世界上软件工程师AIDevin(人工智能软件工程师世界上自己的模型)「世界著名软件工程师」

前言当前的人工智能市场正在蓬勃发展,尤其是在生成式人工智能领域,随着 OpenAI 于 2023 年推出的 ChatGPT-4 以及本月早些时候推出的 Anthropic AI 的 Claude 3
这些模型减轻了内容开发人员的工作,现在AI领域有了一名软件工程师
不到 72 小时前,Cognition 发布了世界上第一位完全自主的 AI 软件工程师 Devin,为 SWE-bench 编码基准设定了最新的新标准
只需一个提示,Devin 就能够像人类软件工程师一样编写代码或创建网站
在我们深入研究 Devin 之前,我们先熟悉一下它的创造者——Cognition
Cognition是什么?Cognition 成立于 2023 年 11 月,是一家位于美国的专注于推理的应用人工智能实验室
通过利用推理,他们打算解锁人工智能的众多学科
Cognition 目前由曾与Google DeepMind、Cursor、Scale AI 和 Nuro 等科技巨头合作的专业人士和领导者组成
他们已经筹集了 2100 万美元,由 Peter Thiel 的创始人基金领投
Cognition 得到了 DoorDash 首席执行官 Tony Xu 和加密平台 Coinbase 创始人 Fred Ehrsam等巨头的支持
Devin是什么?Devin 是一个自主模型,可以通过单个提示来规划、分析和执行复杂的代码和软件工程任务
它有自己的命令行、代码编辑器和单独的 Web 浏览器
通过在几个不同的 API 提供程序上测试 Meta 的 Llama 2,展示了该模型的功能
在解决问题之前,Devin首先制定了一个分步骤的“计划”
然后,它使用与人类软件工程师相同的工具来构建整个项目
使用其内置浏览器,Devin 能够调出 API 文档来阅读并学习如何插入每个 API
最后,它构建并部署了一个具有完整样式的网站
Devin 的与众不同之处在于它能够从错误中学习
它可以做出数千个决定,并且随着时间的推移变得更好
当它在一些标准的软件工程问题集上进行测试时,它的性能优于其他解决方案
Devin 还就 AI 任务接受了顶尖科技品牌的面试,并到了它的期望
它还完成了Upwork上发布的真实工作中的任务,例如编码任务、调试计算机视觉模型以及生成详细报告
Devin 的短暂体验是通过 GitHub Copilot(一种代码补全工具)感受到的
程序员可以将提示转换为可运行的代码
该AI编码器不仅可以完成代码块,还可以将它们翻译成多种语言
相当令人印象深刻,对吧? 但 Devin 更上一层楼,能够在没有人工干预的情况下从头到尾完成代码
Devin如何工作?如前所述,Devin 有自己的命令行、自己的代码提示器部分以及自己的用于收集资源的 Web 浏览器
当输入提示时,Devin进入“计划者”模式,其中分步指南解释了如何解决问题
人工智能软件工程师,Devin网站主页完成此操作后,网站主页将变为四部分界面:第一,所有输入提示;第二,命令行部分;第三,码编辑器;第四,浏览器,对资源进行透彻分析、推论
最后给出了解决方案的可视化
如何访问Devin?Devin 可供抢先体验,人们可以通过加入候补名单来使用或“雇用”Devin
Devin 与其他模型相比如何?Devin 已经在 SWE-bench 上进行了测试,这是一个最常被软件工程师使用的基准测试平台,采用任务代理解决开源项目的实际问题
根据 Cognition 的说法,Devin 是在数据集的随机 25% 子集上进行了评估
所有模型都得到了协助,即模型被告知需要编辑的确切文件,而Devin则没有得到协助
Devin 端到端正确解决了 13.86% 的问题,这比 Claude 2 的 4.8% 和 ChatGPT-4 的 1.74% 有了巨大的飞跃
Cognition 表示他们将很快发布更详细的技术报告
Devin在SWE-bench上的基准测试结果Devin 会取代软件工程师吗?正如基准测试中所看到的令人印象深刻的数字,引起了人们,尤其是软件开发人员和工程师对软件工作和相关工作的未来的思考
Cognition 是一家专注于推理的应用人工智能实验室,声称正在打造具有超越现有人工智能工具能力的人工智能团队成员
Cognition 表示,“Devin 是一位不知疲倦、技术精湛的队友,同样准备好与您一起构建或独立完成供您检查的任务
有了 Devin,工程师可以专注于更有趣的问题,工程团队可以为更雄心勃勃的目标而努力”
有趣的是,正如大多数人认为 Devin 是许多软件工程师的终结一样,Devin 的制造者 Cognition 正在积极招聘“人类”软件工程师
人们的意见不一,在Devin得到充分测试之前,我们无法得出任何结论
正如特斯拉前人工智能总监Andrej Karpathy 所言:“在我看来,自动化软件工程看起来与自动驾驶类似
” 他接着说,软件工程正在发生重大变化
它将涉及更多受监督的自动化,同时用英语传达高级命令、想法或进展策略
就像任何其他生成式人工智能工具一样,Devin 的表现取决于使用它的人
这些只是高效用户手中的工具,使他/她的任务变得不那么繁琐和耗时
结论Devin AI 在生成人工智能领域向前迈出了一大步,通过自动化编码任务和复杂问题彻底改变了软件开发领域
随着 GPT-4、Claude 3 等模型的出现,以及现在 Devin 的出现,生成式 AI 的未来似乎充满希望; 他们不是来取代我们的,而是来帮助我们的
源自https://opencv.org/blog/devin-ai-software-engineer/?_refluxos=a10
世界上软件工程师AIDevin(人工智能软件工程师世界上自己的模型)
(图片来源网络,侵删)

联系我们

在线咨询:点击这里给我发消息