Skip to content

中英术语对照表

全课程核心术语中英对照。按模块分组,方便查阅。

通用概念

中文English说明
基础模型Foundation Model在广泛数据上预训练、可适应多任务的大型模型
预训练Pretraining在大规模数据上训练模型以学习通用表征
微调Fine-tuning在预训练模型基础上用任务特定数据进一步训练
下游任务Downstream Task基于预训练模型解决的特定应用任务
泛化Generalization模型在未见数据上的表现能力
过拟合Overfitting模型过度记忆训练数据而失去泛化能力
涌现Emergence模型规模增大到阈值后突然出现的全新能力
Scaling 定律Scaling Laws描述性能与算力/数据/参数关系的经验规律
迁移学习Transfer Learning将一个任务学到的知识应用到另一任务
零样本学习Zero-shot Learning不经过微调直接执行未见过的任务
少样本学习Few-shot Learning通过少量示例执行新任务(含上下文学习)
上下文学习In-Context LearningLLM 通过在输入中提供示例来学习的现象

数据与结构

中文English说明
模态Modality数据的存在形式(文本、图像、音频等)
异质性Heterogeneity不同模态在结构、维数、分布上的差异
词元Token文本/数据的最小处理单元
词嵌入Word Embedding将词映射到连续向量空间的表示
表示学习Representation Learning自动从数据中学习有用特征表示的方法
自监督学习Self-supervised Learning从数据自身结构构造监督信号的学习范式
对比学习Contrastive Learning通过拉近正样本对、推远负样本对来学习表征

模型架构

中文English说明
循环神经网络RNN处理序列数据的递归架构
长短期记忆网络LSTM解决长序列梯度问题的 RNN 变体
卷积神经网络CNN处理网格结构数据(如图像)的卷积架构
注意力机制Attention动态加权输入各部分重要性的机制
自注意力Self-Attention序列内各位置之间的注意力计算
TransformerTransformer完全基于注意力的序列到序列架构
多头注意力Multi-Head Attention并行计算多个注意力的机制
位置编码Position Encoding为 Transformer 注入序列位置信息的编码
图神经网络GNN处理图结构数据的神经网络
几何深度学习Geometric Deep Learning利用对称性和不变性统一架构设计的框架

多模态AI

中文English说明
多模态Multimodal涉及两种及以上数据模态的系统或方法
多模态对齐Multimodal Alignment在不同模态间建立跨模态对应关系
多模态融合Multimodal Fusion将多模态信息组合为统一表示
跨模态迁移Cross-modal Transfer一种模态的知识迁移到另一种模态
早期融合Early Fusion在输入层即融合多种模态
晚期融合Late Fusion在决策层融合各模态的处理结果
混合融合Hybrid Fusion结合早期和非线性融合的策略
协同信息Synergy多模态交互中超出各模态独立信息的组合增益
冗余信息Redundancy多模态间共享的重复信息
对比语言-图像预训练CLIP通过图文对比学习训练的多模态模型
Q-FormerQ-FormerBLIP-2 中用于连接视觉和语言的查询 Transformer

大模型

中文English说明
大语言模型LLM (Large Language Model)大规模预训练的语言模型
多模态大语言模型MLLM (Multimodal LLM)能处理多种模态的大语言模型
思维链Chain-of-Thought (CoT)通过展示中间推理步骤来引导 LLM 推理
自洽性Self-Consistency采样多条推理路径后取多数结果
思维树Tree-of-Thought (ToT)搜索多条推理路径并对中间状态评估
测试时计算扩展Test-time Compute Scaling推理阶段增加计算量以提升性能
蒙提卡罗树搜索MCTS用于搜索决策空间的树搜索算法
搜索-推理协同ReAct推理(Reasoning)+ 行动(Acting)的交替框架
具身AIEmbodied AI在物理世界中感知、推理和行动的 AI

对齐与评估

中文English说明
AI 对齐AI Alignment确保 AI 系统的目标和行为符合人类意图
基于人类反馈的强化学习RLHF用人类偏好数据训练奖励模型再优化策略
直接偏好优化DPO直接在偏好数据上优化策略(无需奖励模型)
奖励模型Reward Model学习预测人类偏好的模型
近端策略优化PPORLHF 中使用的策略梯度方法
监督微调SFT (Supervised Fine-Tuning)用人工标注数据对模型进行有监督微调
红队测试Red-teaming模拟攻击以发现系统安全漏洞
宪法 AIConstitutional AI通过AI反馈实现无害化对齐的方法
对齐税Alignment Tax对齐训练导致的能力下降成本
基准测试Benchmark标准化评估数据集和指标

人机交互

中文English说明
人机交互HCI / Human-AI Interaction人与 AI 系统交互的设计与研究
共享自主权Shared Autonomy人类与 AI 动态分配控制权
人在回路Human-in-the-Loop人类参与 AI 系统决策循环
AI 智能体AI Agent能自主感知、规划和行动的 AI 系统
AI 工具AI Tool辅助人类完成特定任务的 AI 系统
具身假说Embodiment Hypothesis智能需要物理交互经验的假说
Sim2RealSim-to-Real Transfer从仿真环境迁移到真实世界的方法
视觉-语言-行动模型VLA Model联合处理视觉、语言并输出行动的模型

[[MOC-如何AI一切|🗺️ 返回内容地图]]

基于 MIT MAS.S60 How to AI (Almost) Anything 翻译改编