Skip to content

讨论07:伦理与社会影响

🔍 扩展内容 — 本节适合对AI伦理关心所有学员

讨论主题

基础模型的广泛能力带来了前所未有的社会影响。作为AI从业者,我们需要思考:如何负责任地开发和部署AI系统?

阅读材料

  1. On the Opportunities and Risks of Foundation Models (AI伦理部分)

    • Bommasani et al., 2021
    • https://arxiv.org/abs/2108.07258
    • 中文摘要:斯坦福CRFM的基础模型报告中,专门讨论了基础模型带来的社会风险:偏见放大、错误信息、环境影响、劳动力市场冲击等。提出了负责任的基础模型开发框架。
  2. Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned

    • Ganguli et al., 2022 (Anthropic)
    • https://arxiv.org/abs/2209.07858
    • 中文摘要:Anthropic的红队测试工作,系统分析了语言模型的安全漏洞随规模扩大的变化趋势,提出了多层次的红队测试方法。
  3. The Irreducible Difficulty of "AI Alignment"

    • Rohit et al., 2024
    • 中文摘要:分析了AI对齐问题的"不可约难度"——对齐问题的某些根本性的困难可能无法通过技术手段完全解决。
  4. Agents: An Open-Source Framework for Autonomous Language Agents

    • AI alignment perspective
    • 讨论代理安全性:如何确保自主AI代理的行为可控?

核心议题

  • 偏见与公平:基础模型中的社会偏见如何检测和缓解?
  • 安全与对齐:红队测试和RLHF的局限性
  • 环境影响:大模型训练和推理的碳足迹
  • 劳动力市场:AI到底在创造还是在消除就业机会?
  • 监管与治理:全球AI治理的发展方向

[[MOC-如何AI一切|🗺️ 返回内容地图]]

基于 MIT MAS.S60 How to AI (Almost) Anything 翻译改编