第12-15周阅读:人机交互与项目
⭐ 核心路径 — 以下为人机交互模块核心阅读
§ 第12-13周:人机交互导论
必读
Guidelines for Human-AI Interaction
- Amershi et al., CHI 2019 (Microsoft Research)
- https://arxiv.org/abs/1906.09737
- 中文摘要:微软研究院提出的人机AI交互18条设计指南,涵盖四个阶段:初期、交互中、出错时、长期使用。每一条都有实证研究支持。这是目前最具影响力的AI交互设计指南之一。
- 要点:18条指南、四个阶段框架、设计原则的实证基础
Shared Autonomy via Deep Reinforcement Learning
- Jain et al., RSS 2020
- 中文摘要:研究人机共享自主权(Shared Autonomy)问题——AI代理如何在人类控制与自主行动之间动态分配控制权。通过深度强化学习学习何时干预、何时放手。
- 要点:共享自主权、动态控制分配、人机协作
Human-Centered AI
- Shneiderman, 2022
- 中文摘要:现代人机交互之父Ben Shneiderman提出的以人为中心的AI框架。他反对将AI(自动化)和HCI(工具)对立,主张AI系统应设计为增强人类能力而非替代人类。
- 要点:人本AI、增强而非替代、HCI-AI融合
扩展阅读
- AI-Assisted Decision Making: A Cognitive Modeling Approach — AI辅助决策的认知模型
- When Does AI Help AI Hurt? (Harvard Business Review) — 管理视角的AI效能分析
§ 第14-15周:具身AI
必读
RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control
- Google DeepMind, 2023
- https://arxiv.org/abs/2307.15818
- 中文摘要:展示了如何将互联网级视觉-语言知识迁移到机器人控制。RT-2将网络上的图文数据训练出的视觉语言模型,通过微调使其输出机器人动作token,实现了零样本的机器人技能泛化。
- 要点:互联网知识迁移、视觉语言行动模型、零样本泛化
The Embodiment of Intelligence
- Brooks, 1990 (经典)
- 中文摘要:Rodney Brooks的经典论文,提出了"智力的具身性"观点——真正的智能不能脱离物理世界和感知行动循环而存在。这是具身AI领域的奠基性思想。
- 要点:无表示智能、包容架构、物理交互的重要性
扩展阅读
- Where Does the Embodiment Hypothesis Lead? — 具身假说的演进和当前状态
- SayCan: Do As I Can, Not As I Say — LLM+机器人结合的具身智能
- Mobile ALOHA: Learning Bimanual Mobile Manipulation — 双臂移动操作
[[MOC-如何AI一切|🗺️ 返回内容地图]]
