中英术语对照表
全课程核心术语中英对照。按模块分组,方便查阅。
通用概念
| 中文 | English | 说明 |
|---|---|---|
| 基础模型 | Foundation Model | 在广泛数据上预训练、可适应多任务的大型模型 |
| 预训练 | Pretraining | 在大规模数据上训练模型以学习通用表征 |
| 微调 | Fine-tuning | 在预训练模型基础上用任务特定数据进一步训练 |
| 下游任务 | Downstream Task | 基于预训练模型解决的特定应用任务 |
| 泛化 | Generalization | 模型在未见数据上的表现能力 |
| 过拟合 | Overfitting | 模型过度记忆训练数据而失去泛化能力 |
| 涌现 | Emergence | 模型规模增大到阈值后突然出现的全新能力 |
| Scaling 定律 | Scaling Laws | 描述性能与算力/数据/参数关系的经验规律 |
| 迁移学习 | Transfer Learning | 将一个任务学到的知识应用到另一任务 |
| 零样本学习 | Zero-shot Learning | 不经过微调直接执行未见过的任务 |
| 少样本学习 | Few-shot Learning | 通过少量示例执行新任务(含上下文学习) |
| 上下文学习 | In-Context Learning | LLM 通过在输入中提供示例来学习的现象 |
数据与结构
| 中文 | English | 说明 |
|---|---|---|
| 模态 | Modality | 数据的存在形式(文本、图像、音频等) |
| 异质性 | Heterogeneity | 不同模态在结构、维数、分布上的差异 |
| 词元 | Token | 文本/数据的最小处理单元 |
| 词嵌入 | Word Embedding | 将词映射到连续向量空间的表示 |
| 表示学习 | Representation Learning | 自动从数据中学习有用特征表示的方法 |
| 自监督学习 | Self-supervised Learning | 从数据自身结构构造监督信号的学习范式 |
| 对比学习 | Contrastive Learning | 通过拉近正样本对、推远负样本对来学习表征 |
模型架构
| 中文 | English | 说明 |
|---|---|---|
| 循环神经网络 | RNN | 处理序列数据的递归架构 |
| 长短期记忆网络 | LSTM | 解决长序列梯度问题的 RNN 变体 |
| 卷积神经网络 | CNN | 处理网格结构数据(如图像)的卷积架构 |
| 注意力机制 | Attention | 动态加权输入各部分重要性的机制 |
| 自注意力 | Self-Attention | 序列内各位置之间的注意力计算 |
| Transformer | Transformer | 完全基于注意力的序列到序列架构 |
| 多头注意力 | Multi-Head Attention | 并行计算多个注意力的机制 |
| 位置编码 | Position Encoding | 为 Transformer 注入序列位置信息的编码 |
| 图神经网络 | GNN | 处理图结构数据的神经网络 |
| 几何深度学习 | Geometric Deep Learning | 利用对称性和不变性统一架构设计的框架 |
多模态AI
| 中文 | English | 说明 |
|---|---|---|
| 多模态 | Multimodal | 涉及两种及以上数据模态的系统或方法 |
| 多模态对齐 | Multimodal Alignment | 在不同模态间建立跨模态对应关系 |
| 多模态融合 | Multimodal Fusion | 将多模态信息组合为统一表示 |
| 跨模态迁移 | Cross-modal Transfer | 一种模态的知识迁移到另一种模态 |
| 早期融合 | Early Fusion | 在输入层即融合多种模态 |
| 晚期融合 | Late Fusion | 在决策层融合各模态的处理结果 |
| 混合融合 | Hybrid Fusion | 结合早期和非线性融合的策略 |
| 协同信息 | Synergy | 多模态交互中超出各模态独立信息的组合增益 |
| 冗余信息 | Redundancy | 多模态间共享的重复信息 |
| 对比语言-图像预训练 | CLIP | 通过图文对比学习训练的多模态模型 |
| Q-Former | Q-Former | BLIP-2 中用于连接视觉和语言的查询 Transformer |
大模型
| 中文 | English | 说明 |
|---|---|---|
| 大语言模型 | LLM (Large Language Model) | 大规模预训练的语言模型 |
| 多模态大语言模型 | MLLM (Multimodal LLM) | 能处理多种模态的大语言模型 |
| 思维链 | Chain-of-Thought (CoT) | 通过展示中间推理步骤来引导 LLM 推理 |
| 自洽性 | Self-Consistency | 采样多条推理路径后取多数结果 |
| 思维树 | Tree-of-Thought (ToT) | 搜索多条推理路径并对中间状态评估 |
| 测试时计算扩展 | Test-time Compute Scaling | 推理阶段增加计算量以提升性能 |
| 蒙提卡罗树搜索 | MCTS | 用于搜索决策空间的树搜索算法 |
| 搜索-推理协同 | ReAct | 推理(Reasoning)+ 行动(Acting)的交替框架 |
| 具身AI | Embodied AI | 在物理世界中感知、推理和行动的 AI |
对齐与评估
| 中文 | English | 说明 |
|---|---|---|
| AI 对齐 | AI Alignment | 确保 AI 系统的目标和行为符合人类意图 |
| 基于人类反馈的强化学习 | RLHF | 用人类偏好数据训练奖励模型再优化策略 |
| 直接偏好优化 | DPO | 直接在偏好数据上优化策略(无需奖励模型) |
| 奖励模型 | Reward Model | 学习预测人类偏好的模型 |
| 近端策略优化 | PPO | RLHF 中使用的策略梯度方法 |
| 监督微调 | SFT (Supervised Fine-Tuning) | 用人工标注数据对模型进行有监督微调 |
| 红队测试 | Red-teaming | 模拟攻击以发现系统安全漏洞 |
| 宪法 AI | Constitutional AI | 通过AI反馈实现无害化对齐的方法 |
| 对齐税 | Alignment Tax | 对齐训练导致的能力下降成本 |
| 基准测试 | Benchmark | 标准化评估数据集和指标 |
人机交互
| 中文 | English | 说明 |
|---|---|---|
| 人机交互 | HCI / Human-AI Interaction | 人与 AI 系统交互的设计与研究 |
| 共享自主权 | Shared Autonomy | 人类与 AI 动态分配控制权 |
| 人在回路 | Human-in-the-Loop | 人类参与 AI 系统决策循环 |
| AI 智能体 | AI Agent | 能自主感知、规划和行动的 AI 系统 |
| AI 工具 | AI Tool | 辅助人类完成特定任务的 AI 系统 |
| 具身假说 | Embodiment Hypothesis | 智能需要物理交互经验的假说 |
| Sim2Real | Sim-to-Real Transfer | 从仿真环境迁移到真实世界的方法 |
| 视觉-语言-行动模型 | VLA Model | 联合处理视觉、语言并输出行动的模型 |
[[MOC-如何AI一切|🗺️ 返回内容地图]]
