L'intelligence artificielle face aux défis du code autonome

人工智能正在快速迈向未知的领域，声称将改变软件工程。令人着迷的进展引发了关于其真正编码能力的问题和讨论。*自动化是提高效率的主要挑战*，但障碍依然存在，阻碍着这一蓬勃发展的演变。人机间有效沟通的挑战呈现出棘手的难题。*系统性错误常常回响*于算法生成的代码中，引发了对其可靠性的担忧。*这一优化之路需要集体反思*以克服现有的局限性，构建一个真正自主的工程未来。

人工智能在软件开发中的应用

人工智能（AI）在软件开发领域的出现正在挑战传统的职业观念。最近在AI技术上的进展似乎将软件工程的边界推向一个被自动化流程主导的未来。麻省理工学院（MIT）发布的最新文章探讨了阻碍这一演变的挑战。

当前软件工程面临的挑战

这篇名为“面向软件工程的AI挑战与路径”的文件，突显了超越简单代码生成的所有软件任务。它识别出现有的瓶颈，并强调为克服这些瓶颈所需的研究方向。最终的目标是将人类工程师从重复性任务中解放出来，以促进对系统设计和架构的更专注。

主要挑战包括需要每天进行重构和执行大规模迁移旧系统。研究人员强调，开发工作复杂性常常被低估。软件开发远不止于一个简单的编程练习，而是需要各种技能，从严格的测试到数十年前代码的文档整理。

AI的定量评估

目前，工业规模的代码优化的评估依然存在问题。现有的性能指标通常不适用。例如，SWE-Bench基准评估模型会要求其修正GitHub上的问题。这类评估仍与简单的编程练习有关，未能考虑大型项目中人工智能集成的现实场景。

至关重要的是，评估应当扩大范围，以涵盖关键场景，例如人机合作和AI辅助的重构。只要这些问题得不到解决，衡量进步和促进发展将依然是一个未解之难题。

人机沟通与控制

人机间的沟通同样存在显著障碍。首位作者Alex Gu指出，当前的交互方式相似于一条不令人满意的通信渠道。当系统生成代码时，开发者常常收到结构不良的文件，这使得理解变得复杂。AI在代码的特定部分未能表明其信心水平，这削弱了开发人员的决策能力。

如果没有指示哪些区域需要验证，工程师可能会相信来自错误逻辑的代码。这种缺乏透明度可能导致生产故障并危及系统的可靠性。人工智能必须学会在必要时向用户请求澄清。

代码库的特性

对于庞大的代码库，困难变得更加明显。当前的AI模型在处理达到数百万行的项目时掣肘。由于每个公司的编码约定和规范的独特性，两者之间的模糊性增加了AI的学习难度。经过在如GitHub的公共代码库上培训的模型，由于标准的多样性，超出了其能力范围。

这导致生成的代码，尽管呈现出某种逻辑，但却使用了不存在的函数。风格规则的违反或持续集成管道的失败经常出现。这些错误通常被归因于幻觉，导致生成看似合理、但不符合企业内部实践的代码。

呼吁扩大协作的行动

面对这些挑战，研究的作者呼吁开展社区层面的协作倡议。需要丰富的数据集，以捕捉编码过程的复杂性。团队必须考虑共享评估模型，以衡量重构的质量和错误修复的持久性。

Gu将这一请求表述为一个行动呼吁，以激励大规模的开源合作。研究应逐一解决主要难题，意在将这些成果整合进商业工具中。该过程将朝着使AI在工程师的角色中真正助力的方向发展，而不仅仅是自动补全的功能。

充分实现AI在软件开发中的潜力提出了重大问题。未来系统的可靠性和安全性仍然存在挑战。每一次进步都应以谨慎的态度欢迎，以确保AI为开发过程中的创造力、战略和伦理做出贡献。

关于人工智能和软件工程的常见问题

人工智能在软件开发领域的主要能力是什么？
人工智能可以帮助自动化任务，例如代码生成、重构、旧系统迁移和错误检测，使工程师能够专注于更复杂的问题。

人工智能在软件工程中当前面临的挑战是什么？
主要挑战包括理解项目的特定需求、管理大型代码库，以及创建与企业内部约定一致的代码。

人工智能为何难以处理大规模代码库？
人工智能模型往往难以处理大型代码库，因为每个项目都有独特的特性，这使得学习和应用编码约定变得复杂。

人工智能如何与人类开发者进行沟通？
目前，AI与开发者之间的沟通有限；系统通常生成结构不良的代码，并且对生成的代码某些部分的信心水平缺乏透明度。

为了使人工智能成为软件工程中的真正合作伙伴，需要哪些进展？
需要开发出允许更严格评估生成代码的工具、共享评估标准，以及更好地整合人类与AI系统之间的沟通。

哪些类型的衡量可以改善人工智能在软件工程中的发展？
评估重构质量、错误修复耐久性以及迁移精确度的衡量标准可以为软件开发自动化的进步提供宝贵的指标。

将来将人工智能整合到软件开发中的愿景是什么？
未来的愿景包括一种能够减少重复性和技术性任务的AI，从而让开发者专注于软件开发中的战略、创造力和伦理。

人工智能真的能编码吗？一项研究探讨了自助软件工程的障碍

人工智能在软件开发中的应用

当前软件工程面临的挑战

AI的定量评估

人机沟通与控制

代码库的特性

呼吁扩大协作的行动

关于人工智能和软件工程的常见问题

谷歌承诺在印度投资100亿美元用于人工智能数据中心项目

特朗普的假支持者：在社交媒体上推动的虚假抗议者

著作權法中的TDM例外：歐洲人工智能發展的關鍵優勢

分析揭示：86% 的人工智能引用来自品牌控制的来源

「ChatGPT，我的無價盟友」：在拼寫上遇到困難的年輕專業人士的巧妙小技巧

演员们坚决反对在人工智能生成的内容中使用他们的形象：这是对公平的威胁

人工智能真的能编码吗？一项研究探讨了自助软件工程的障碍

人工智能在软件开发中的应用

当前软件工程面临的挑战

AI的定量评估

人机沟通与控制

代码库的特性

呼吁扩大协作的行动

关于人工智能和软件工程的常见问题

.tdi_114{z-index:84546!important}特朗普的假支持者：在社交媒体上推动的虚假抗议者

.tdi_133{z-index:84546!important}著作權法中的TDM例外：歐洲人工智能發展的關鍵優勢

.tdi_152{z-index:84546!important}分析揭示：86% 的人工智能引用来自品牌控制的来源

.tdi_171{z-index:84546!important}「ChatGPT，我的無價盟友」：在拼寫上遇到困難的年輕專業人士的巧妙小技巧

.tdi_190{z-index:84546!important}演员们坚决反对在人工智能生成的内容中使用他们的形象：这是对公平的威胁

特朗普的假支持者：在社交媒体上推动的虚假抗议者

著作權法中的TDM例外：歐洲人工智能發展的關鍵優勢

分析揭示：86% 的人工智能引用来自品牌控制的来源

「ChatGPT，我的無價盟友」：在拼寫上遇到困難的年輕專業人士的巧妙小技巧

演员们坚决反对在人工智能生成的内容中使用他们的形象：这是对公平的威胁