Anthropic 提倡对人工智能进行前瞻性监管,强调对社会潜在的风险。*人工智能系统将快速演变,增加滥用和事故的风险。* 这种动态呼吁采取严肃的措施,以确保这些技术的伦理和安全使用。*由于缺乏适当规则而引发的灾难可能严重影响我们的日常生活。* 面对这一现实,法律框架必须调整,以防止前所未有的危机。
呼吁监管
Anthropic 最近指出与人工智能系统相关的潜在风险。该机构强调制定有结构的监管以防止可能的灾难的必要性。其主要论点在于,实施针对性的监管对于在利用人工智能的好处的同时,限制其风险至关重要。
人工智能演变带来的风险加剧
人工智能系统的发展,特别是在数学、推理和编程能力方面,令人担忧。可在网络安全领域以及生物和化学学科中被滥用的可能性正在迅速增加。
政策制定者的行动窗口
Anthropic 警告说,接下来的 18 个月对于政策制定者至关重要。实施预防性措施的窗口正在迅速缩小。Frontier Red Team 的成员指出,当前的模型已经能够完成许多与网络攻击相关的任务。
CBRN 威胁
一个真正令人担忧的话题是人工智能系统加剧化学、生物、放射性和核(CBRN)威胁相关风险的潜力。根据英国人工智能安全研究所的说法,多个人工智能模型现已达到博士水平的科学问题解决能力。
负责任扩展政策
为应对这些挑战,Anthropic 提出了其负责任扩展政策 (RSP),于 2023 年 9 月发布。该规定要求根据人工智能能力的复杂性提高安全和保障措施。
灵活性与持续改进
RSP 的结构旨在适应变化,定期评估人工智能模型。这允许快速优化安全协议。Anthropic 表示致力于维护和改善这一安全性,尤其是在安全、可解释性和信任等领域的团队扩展方面。
全球监管
在整个人工智能产业中遵守 RSP 被认为是有效管理风险的关键。清晰有效的监管是必要的,以确保公众对人工智能企业遵循安全承诺的信心。
战略性监管框架
监管框架必须具有战略性,促进安全做法而不施加过重的负担。Anthropic 主张制定针对性的监管,关注人工智能模型的基本属性和安全措施,以适应不断变化的技术环境。
美国的立法框架
在美国,Anthropic 建议联邦立法可能是规管人工智能风险的最终解决方案。然而,若联邦行动拖延,可能需要州级的倡议。
标准化与互认
各国制定的法规应促进标准化和互认,从而支持人工智能的全球安全议程。这将有助于降低不同地区合规的成本。
监管与创新之间的平衡
Anthropic 还解决了对建立监管的怀疑,声明过于宽泛的法规将不足以应对具体使用场景。监管必须优先考虑某些关键特征,同时考虑多种风险。
短期威胁
尽管 Anthropic 涉及许多风险,但某些即时危险,如虚假深度伪造是由其他倡议处理的。这个战略性选择旨在避免分散努力,集中关注最重大挑战。
促进创新的监管
监管应在不扼杀创新的前提下鼓励技术进步。Anthropic 认为,遵从性初期的负担可以通过灵活且设计良好的安全测试来减轻。
以经验为基础的风险管理
提议的监管框架聚焦于以经验为基础的可衡量风险,而不偏向某种特定的人工智能模型。总的目标是通过严格但灵活的监管来管理尖端人工智能模型的重大风险。
关于 Anthropic 人工智能监管的常见问题
为什么 Anthropic 呼吁对人工智能进行监管?
Anthropic 强调与具有先进能力的人工智能系统相关的潜在风险。进行监管的必要性在于确保人工智能的负责任使用,同时最大化其对社会的好处。
Anthropic 确定了哪些类型的人工智能风险?
风险包括人工智能在网络安全等领域的恶意使用,以及与生物技术和危险材料相关的潜在威胁。如果不加以适当监管,这些技术可能会加剧现有的危险。
根据 Anthropic,政策制定者的关键时间段是多长?
Anthropic 强调,未来的 18 个月对于政策制定者采取前瞻性措施以防止与人工智能相关的潜在灾难至关重要,因为干预的窗口正在迅速缩小。
Anthropic 的负责任扩展政策 (RSP) 是什么?
RSP 是 Anthropic 为增强人工智能系统安全和保障而建立的一项政策。它规定安全措施应根据人工智能的能力复杂性加以提高,从而确保一种自适应和迭代的方法。
Anthropic 如何看待人工智能监管以促进创新?
Anthropic 主张明确和有针对性的监管,专注于人工智能模型的基本属性,促进安全实践而不会对企业施加不必要的负担。目标是刺激创新,同时管理风险。
Anthropic 对美国立法倡议的态度如何?
Anthropic 建议联邦立法可能是解决与人工智能相关风险的终极答案,同时承认如果联邦行动延迟,可能需要州级倡议。
Anthropic 如何处理有关人工智能特定使用情况(如虚假深度伪造)的担忧?
尽管像虚假深度伪造这样的威胁令人担忧,Anthropic 主要聚焦于人工智能系统更广泛的风险。他们认为,其他倡议已经在处理这些直接的关注。