中英术语对照表

全课程核心术语中英对照。按模块分组，方便查阅。

通用概念

中文	English	说明
基础模型	Foundation Model	在广泛数据上预训练、可适应多任务的大型模型
预训练	Pretraining	在大规模数据上训练模型以学习通用表征
微调	Fine-tuning	在预训练模型基础上用任务特定数据进一步训练
下游任务	Downstream Task	基于预训练模型解决的特定应用任务
泛化	Generalization	模型在未见数据上的表现能力
过拟合	Overfitting	模型过度记忆训练数据而失去泛化能力
涌现	Emergence	模型规模增大到阈值后突然出现的全新能力
Scaling 定律	Scaling Laws	描述性能与算力/数据/参数关系的经验规律
迁移学习	Transfer Learning	将一个任务学到的知识应用到另一任务
零样本学习	Zero-shot Learning	不经过微调直接执行未见过的任务
少样本学习	Few-shot Learning	通过少量示例执行新任务（含上下文学习）
上下文学习	In-Context Learning	LLM 通过在输入中提供示例来学习的现象

数据与结构

中文	English	说明
模态	Modality	数据的存在形式（文本、图像、音频等）
异质性	Heterogeneity	不同模态在结构、维数、分布上的差异
词元	Token	文本/数据的最小处理单元
词嵌入	Word Embedding	将词映射到连续向量空间的表示
表示学习	Representation Learning	自动从数据中学习有用特征表示的方法
自监督学习	Self-supervised Learning	从数据自身结构构造监督信号的学习范式
对比学习	Contrastive Learning	通过拉近正样本对、推远负样本对来学习表征

模型架构

中文	English	说明
循环神经网络	RNN	处理序列数据的递归架构
长短期记忆网络	LSTM	解决长序列梯度问题的 RNN 变体
卷积神经网络	CNN	处理网格结构数据（如图像）的卷积架构
注意力机制	Attention	动态加权输入各部分重要性的机制
自注意力	Self-Attention	序列内各位置之间的注意力计算
Transformer	Transformer	完全基于注意力的序列到序列架构
多头注意力	Multi-Head Attention	并行计算多个注意力的机制
位置编码	Position Encoding	为 Transformer 注入序列位置信息的编码
图神经网络	GNN	处理图结构数据的神经网络
几何深度学习	Geometric Deep Learning	利用对称性和不变性统一架构设计的框架

多模态AI

中文	English	说明
多模态	Multimodal	涉及两种及以上数据模态的系统或方法
多模态对齐	Multimodal Alignment	在不同模态间建立跨模态对应关系
多模态融合	Multimodal Fusion	将多模态信息组合为统一表示
跨模态迁移	Cross-modal Transfer	一种模态的知识迁移到另一种模态
早期融合	Early Fusion	在输入层即融合多种模态
晚期融合	Late Fusion	在决策层融合各模态的处理结果
混合融合	Hybrid Fusion	结合早期和非线性融合的策略
协同信息	Synergy	多模态交互中超出各模态独立信息的组合增益
冗余信息	Redundancy	多模态间共享的重复信息
对比语言-图像预训练	CLIP	通过图文对比学习训练的多模态模型
Q-Former	Q-Former	BLIP-2 中用于连接视觉和语言的查询 Transformer

大模型

中文	English	说明
大语言模型	LLM (Large Language Model)	大规模预训练的语言模型
多模态大语言模型	MLLM (Multimodal LLM)	能处理多种模态的大语言模型
思维链	Chain-of-Thought (CoT)	通过展示中间推理步骤来引导 LLM 推理
自洽性	Self-Consistency	采样多条推理路径后取多数结果
思维树	Tree-of-Thought (ToT)	搜索多条推理路径并对中间状态评估
测试时计算扩展	Test-time Compute Scaling	推理阶段增加计算量以提升性能
蒙提卡罗树搜索	MCTS	用于搜索决策空间的树搜索算法
搜索-推理协同	ReAct	推理（Reasoning）+ 行动（Acting）的交替框架
具身AI	Embodied AI	在物理世界中感知、推理和行动的 AI

对齐与评估

中文	English	说明
AI 对齐	AI Alignment	确保 AI 系统的目标和行为符合人类意图
基于人类反馈的强化学习	RLHF	用人类偏好数据训练奖励模型再优化策略
直接偏好优化	DPO	直接在偏好数据上优化策略（无需奖励模型）
奖励模型	Reward Model	学习预测人类偏好的模型
近端策略优化	PPO	RLHF 中使用的策略梯度方法
监督微调	SFT (Supervised Fine-Tuning)	用人工标注数据对模型进行有监督微调
红队测试	Red-teaming	模拟攻击以发现系统安全漏洞
宪法 AI	Constitutional AI	通过AI反馈实现无害化对齐的方法
对齐税	Alignment Tax	对齐训练导致的能力下降成本
基准测试	Benchmark	标准化评估数据集和指标

人机交互

中文	English	说明
人机交互	HCI / Human-AI Interaction	人与 AI 系统交互的设计与研究
共享自主权	Shared Autonomy	人类与 AI 动态分配控制权
人在回路	Human-in-the-Loop	人类参与 AI 系统决策循环
AI 智能体	AI Agent	能自主感知、规划和行动的 AI 系统
AI 工具	AI Tool	辅助人类完成特定任务的 AI 系统
具身假说	Embodiment Hypothesis	智能需要物理交互经验的假说
Sim2Real	Sim-to-Real Transfer	从仿真环境迁移到真实世界的方法
视觉-语言-行动模型	VLA Model	联合处理视觉、语言并输出行动的模型

[[MOC-如何AI一切|🗺️ 返回内容地图]]