前言当前的人工智能市场正在蓬勃发展,尤其是在生成式人工智能领域,随着 OpenAI 于 2023 年推出的 ChatGPT-4 以及本月早些时候推出的 Anthropic AI 的 Claude 3 这些模型减轻了内容开发人员的工作,现在AI领域有了一名软件工程师不到 72 小时前,Cognition 发布了世界上第一位完全自主的 AI 软件工程师 Devin,为 SWE-bench 编码基准设定了最新的新标准 只需一个提示,Devin 就能够像人类软件工程师一样编写代码或创建网站在我们深入研究 Devin 之前,我们先熟悉一下它的创造者——CognitionCognition是什么?Cognition 成立于 2023 年 11 月,是一家位于美国的专注于推理的应用人工智能实验室 通过利用推理,他们打算解锁人工智能的众多学科Cognition 目前由曾与Google DeepMind、Cursor、Scale AI 和 Nuro 等科技巨头合作的专业人士和领导者组成 他们已经筹集了 2100 万美元,由 Peter Thiel 的创始人基金领投 Cognition 得到了 DoorDash 首席执行官 Tony Xu 和加密平台 Coinbase 创始人 Fred Ehrsam等巨头的支持Devin是什么?Devin 是一个自主模型,可以通过单个提示来规划、分析和执行复杂的代码和软件工程任务 它有自己的命令行、代码编辑器和单独的 Web 浏览器通过在几个不同的 API 提供程序上测试 Meta 的 Llama 2,展示了该模型的功能 在解决问题之前,Devin首先制定了一个分步骤的“计划” 然后,它使用与人类软件工程师相同的工具来构建整个项目 使用其内置浏览器,Devin 能够调出 API 文档来阅读并学习如何插入每个 API 最后,它构建并部署了一个具有完整样式的网站Devin 的与众不同之处在于它能够从错误中学习 它可以做出数千个决定,并且随着时间的推移变得更好当它在一些标准的软件工程问题集上进行测试时,它的性能优于其他解决方案Devin 还就 AI 任务接受了顶尖科技品牌的面试,并到了它的期望 它还完成了Upwork上发布的真实工作中的任务,例如编码任务、调试计算机视觉模型以及生成详细报告Devin 的短暂体验是通过 GitHub Copilot(一种代码补全工具)感受到的 程序员可以将提示转换为可运行的代码 该AI编码器不仅可以完成代码块,还可以将它们翻译成多种语言 相当令人印象深刻,对吧? 但 Devin 更上一层楼,能够在没有人工干预的情况下从头到尾完成代码Devin如何工作?如前所述,Devin 有自己的命令行、自己的代码提示器部分以及自己的用于收集资源的 Web 浏览器当输入提示时,Devin进入“计划者”模式,其中分步指南解释了如何解决问题人工智能软件工程师,Devin网站主页完成此操作后,网站主页将变为四部分界面:第一,所有输入提示;第二,命令行部分;第三,码编辑器;第四,浏览器,对资源进行透彻分析、推论最后给出了解决方案的可视化如何访问Devin?Devin 可供抢先体验,人们可以通过加入候补名单来使用或“雇用”DevinDevin 与其他模型相比如何?Devin 已经在 SWE-bench 上进行了测试,这是一个最常被软件工程师使用的基准测试平台,采用任务代理解决开源项目的实际问题 根据 Cognition 的说法,Devin 是在数据集的随机 25% 子集上进行了评估 所有模型都得到了协助,即模型被告知需要编辑的确切文件,而Devin则没有得到协助 Devin 端到端正确解决了 13.86% 的问题,这比 Claude 2 的 4.8% 和 ChatGPT-4 的 1.74% 有了巨大的飞跃 Cognition 表示他们将很快发布更详细的技术报告Devin在SWE-bench上的基准测试结果Devin 会取代软件工程师吗?正如基准测试中所看到的令人印象深刻的数字,引起了人们,尤其是软件开发人员和工程师对软件工作和相关工作的未来的思考Cognition 是一家专注于推理的应用人工智能实验室,声称正在打造具有超越现有人工智能工具能力的人工智能团队成员Cognition 表示,“Devin 是一位不知疲倦、技术精湛的队友,同样准备好与您一起构建或独立完成供您检查的任务 有了 Devin,工程师可以专注于更有趣的问题,工程团队可以为更雄心勃勃的目标而努力”有趣的是,正如大多数人认为 Devin 是许多软件工程师的终结一样,Devin 的制造者 Cognition 正在积极招聘“人类”软件工程师
人们的意见不一,在Devin得到充分测试之前,我们无法得出任何结论正如特斯拉前人工智能总监Andrej Karpathy 所言:“在我看来,自动化软件工程看起来与自动驾驶类似” 他接着说,软件工程正在发生重大变化 它将涉及更多受监督的自动化,同时用英语传达高级命令、想法或进展策略就像任何其他生成式人工智能工具一样,Devin 的表现取决于使用它的人
这些只是高效用户手中的工具,使他/她的任务变得不那么繁琐和耗时
结论Devin AI 在生成人工智能领域向前迈出了一大步,通过自动化编码任务和复杂问题彻底改变了软件开发领域 随着 GPT-4、Claude 3 等模型的出现,以及现在 Devin 的出现,生成式 AI 的未来似乎充满希望; 他们不是来取代我们的,而是来帮助我们的源自https://opencv.org/blog/devin-ai-software-engineer/?_refluxos=a10
0 评论