上图中提到的cognition就是创造第一代AI程序员Devin的幕后AI公司。什么是SWE呢,它是Software engineering的缩写,也就是软件工程。为什么说他是地表最强的呢?看看下面的数据就知道了。直接是拳打GPT4,脚踢Devin,独领风骚。什么是Genie自从Devin出来以后,用AI写写代码,改改bug已经不是什么新鲜事了。而Genie又能给程序员带来什么新鲜的料呢?Genie背后的公司是cosine,没错这就是我们初中数学正弦余弦里面的余弦,中文是科赛恩,当时没少听老师念叨这个。Genie凭什么能让Devin都望尘莫及呢,用官方团队的话来说就是:
它可以做到像人类工程师一样解决现实生活中的软件问题光说还是把人说的挺热血沸腾的,为了让自己的话得到验证官方也举了几个例子。比如解决 GitHub Issue只需要给 Genie 一个github仓库的地址,它就开始自动开始解决这个问题了。和人解决问题一样,Genie会去找到和这个问题相关的文件一顿猛如虎的操作之后,Genie开始行云流水般的写代码当然AI程序员也可能写bug,但是Genie如果遇到了了自己写的bug,也会对问题进行分析,直到没有bug为止。整个过程,只花了几十秒,我滴个妈呀,不到两分钟。
这个速度,除非是大神级别的人才能偶尔达到,普通人几乎不可能这么快解决问题。对此,官方团队也说了类似的话:Genie 已经观察并学习人类程序员如何解决软件问题的次数达到了数百万次。这是任何一个人类程序员一辈子都无法达到的数量。Gennie为啥这么强我们知道,三个臭皮匠,顶个诸葛亮,但是对于AI来说就不一样了。要想让AI的表现更快更强,没有优秀的数据是不行滴。Cosine在自己的博客文章里说到,他们花了快一年的时间才积累了这个数据集,里面聚集了真实世界里工程师们各种各样的编程活动。里面基本上是一些一流程序员的编程活动,比如他们的每一次提交,留下的技术文档,bug库等数据,Genie通过一流程序员的这些行为去分析重建真实程序员解决问题背后的思维过程。AI程序员的未来在当前的这个历史时间节点,我们不知道AI程序员是否可以几乎完全替代人肉程序员,但是可以看到的是AI程序员在一步步的往这个方向走。
0 评论