Skip to content

教学大纲

核心路径 — 本页为课程整体规划

注意:以下主题和时间安排可能根据学员兴趣和课堂讨论微调。

周次日期主题类型
1第1课AI导论 — 课程介绍、AI 概述⭐讲座
1第2课AI研究方法 — 选题、读论文、做实验⭐讲座
2第3课基础①:数据、结构、信息 — 数据模态、采集、训练目标⭐讲座
2第4课基础②:实用AI工具 — PyTorch、HuggingFace、调试⭐实操
3项目提案报告⭐项目
4第5课基础③:模型架构 — CNN/RNN/Transformer/GNN⭐讲座
4讨论①学习与泛化🔍讨论
5第6课多模态①:连接与对齐 — CLIP、对比学习⭐讲座
5讨论②现代AI架构🔍讨论
6第7课多模态②:交互与融合 — 跨模态融合⭐讲座
6讨论③多模态对齐🔍讨论
7第8课多模态③:跨模态迁移 — 视觉-语言模型⭐讲座
7讨论④多模态交互🔍讨论
8春假
9第9课大模型①:基础模型 — 预训练、微调、LoRA⭐讲座
9项目中期报告⭐项目
10机动周
11第10课大模型②:多模态大模型 — LLaVA、MMLU⭐讲座
11讨论⑤大语言模型🔍讨论
12第11课大模型③:生成式AI — 扩散模型、Flow Matching⭐讲座
12讨论⑥多模态大模型🔍讨论
13讨论⑦生成式AI🔍讨论
14第12课交互①:智能体与推理 — RL、R1、DPO⭐讲座
14项目终期报告⭐项目
15第13课交互②:人机交互 — HITL、安全可靠性⭐讲座

评分构成(MIT 原版参考)

项目占比
项目提案10%
项目中期报告25%
项目终期报告45%
课堂参与+讨论20%

注:用于公司内部培训时,评分构成可灵活调整。

课程教材与资源

本课程没有固定教材,全部基于前沿论文和讲座幻灯片。核心参考资源:

综述论文(必读):

  1. Foundations and Trends in Multimodal Machine Learning: Principles, Challenges, and Open Questions
  2. Representation Learning: A Review and New Perspectives
  3. Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges

实践资源:

  • PyTorch 官方教程
  • HuggingFace 文档
  • MIT 原版讲座视频(YouTube)

[[MOC-如何AI一切|🗺️ 返回内容地图]]

基于 MIT MAS.S60 How to AI (Almost) Anything 翻译改编