Cognition AI推出了Devin,他被描述为世界上第一个完全自主的AI软件工程师。
认知人工智能是由编码专家Scott Wu、Steven Hao和Walden Yan创建的,由Peter Thiel的创始人基金牵头的2100万美元的首轮融资支持。
创始人之一斯科特·吴(Scott Wu)将德文描述为一个“不知疲倦、技术娴熟的队友”,能够与人类一起工作,或独立完成整个项目。
Devin比OpenAI和微软的CoPilot要复杂得多。相反,它可以与人工智能代理相媲美,它将软件从自然语言提示符开发到一个完成的项目中,而不是吐出单个代码段。
Cognition AI发布了一系列视频演示,详细介绍了Devin在广泛的软件开发和工程任务中的能力。
Devin在Cognition AI演示中展示的一些应用程序:
- 适应新技术在审阅了一篇博客文章后,Devin在Modal上成功执行ControlNet,生成嵌入隐藏信息的图像,展示了其创造性地学习和适应输入的能力。
- 端到端应用程序开发Devin自主开发了一个模拟生命游戏的交互式网站。Devin管理整个项目生命周期,从根据用户请求整合功能到在Netlify上部署应用程序。
- 自主调试Devin的另一个关键特性是它能够在没有人为干预的情况下识别和纠正代码库中的bug。Cognition通过展示Devin维护和调试一本开源竞争性编程书籍来证明了这一点。
- 人工智能模型培训:突破了人工智能在软件工程中作用的界限,Devin自主地建立并微调了一个大型语言模型(LLM),只给出了一个到GitHub上的研究库的链接。是的,这是一个能够自主创建AI模型的AI模型。
Devin的能力在SWE-BENCH编码基准上得到了严格的评估。这项具有挑战性的测试要求代理解决开源存储库中真实世界的GitHub问题。
Devin的表现非常出色,端到端正确解决了13.86%的问题,与之前只解决了1.96%的最先进水平相比,这是一个巨大的飞跃。
Wu在接受彭博社采访时说:“教AI成为程序员实际上是一个非常深刻的算法问题,需要系统做出复杂的决策,并展望未来几步,以决定它应该选择什么样的路线。
“这几乎就像这个游戏,我们都在脑海中玩了多年,现在有机会将它编码到人工智能系统中。
这一巨大的改进展示了Devin先进的解决问题的能力,以及它在提高软件开发生产力和效率方面的潜力。
Devin自主执行复杂的软件工程任务的能力让我们看到了手工编程几乎绝迹的未来。
NVIDIA首席执行官Jensen Huang在迪拜举行的世界政府峰会上谈到了这一点,他告诉听众:“我们的工作是创造计算技术,使任何人都不必编程。编程语言是人类的,现在世界上每个人都是程序员。这就是人工智能的奇迹。
然而,人工智能在替代创造性工作方面也非常出色,那么,人类该向哪里求助呢?
这将是关于在培养批判性思维和创造性敏捷性的同时有效使用人工智能—可能在你选择的职业轨迹中获得相当的运气。