一家成立不到两个月但拥有十名天才工程师的初创公司Cognition,搞了一个引爆科技圈的大动作。
他们推出了一款名为Devin的人工智能(AI)助手,能帮助人类软件工程师完成诸多开发任务。Devin不同于现有其他AI编码者,它可以从零构建网站、自行部署应用、修复漏洞、学习新技术等,人类只需扮演一个下指令和监督的角色。
这是第一个真正意义上完全自主的AI软件工程师,一亮相即掀起轩然,因为人们担心:人类程序员是不是真要失业了?
据Cognition官网报道,Devin只需一句指令,即可端到端地处理整个开发项目。
按照客户的真实需求,Devin可以同时执行多步骤工作流程,人类工程师则可以实时观察其进度,发现错误时,跳出指令进行修正。这便于工程师们将大部分工作“外包”给AI,自己则可以潜心于创意性工作。
在SWE-bench基准测试中,Devin的表现远超Claude 2、Llama、GPT-4等选手,能够完整正确地处理13.86%的问题。相较之下,GPT-4只能处理1.74%的问题。更重要的是,Devin在测试中没有正真获得任何帮助,而其他所有模型都需要帮助,即人们要准确告知模型需要编辑哪些文件。
这一进展,标志着AI在自主理解和解决软件开发问题方面取得了显著进步。目前,Devin已经成功通过一家AI公司面试,并且在Upwork上完成了实际工作。
Devin的厉害之处,还在于可以规划和执行异常复杂的工程任务,这类任务常常要数千个决策才能完成。在这之中,无论进行到任何一步,它都可以回调所有相关的上下文信息,保证任务的逻辑性,也便于随时校正。
更让人震撼的是,Devin不仅能帮人们解决代码,还囊括了与之相关的整个工作流。
譬如,当工程师要设计一个网页游戏时,Devin首先能生成网页,接着还能完成服务端的部署,最后直接发布上线,省去了中间大量人工操作。甚至在发现漏洞之后,Devin还会回溯报错出现的位置及对应的数据,然后分析原因并给出解决方案。
此外,作为一个AI全能助手,Devin还能够在一定程度上帮助人类训练和微调其他AI。对于一些常见的模型,你只需要提及模型的名称,Devin自己就知道要怎样去训练。
那人们需要做什么呢?按设想,最终的Devin会让人类只需要发号施令,其他什么也不用做。
初创公司Cognition虽然只有十名员工,但他们手中却握着十块IOI(国际信息学奥林匹克竞赛)金牌,核心创始团队为3名华人。
Devin现处于内测阶段,有意用户可申请提前试用。目前,团队尚未透露更多核心技术细节,但他们表示,Devin源于其长期推理及规划研究的进展。编码只是第一步,这一AI助手其实可推广到更宽领域。
Devin的出现,可能对软件开发行业产生深远影响,甚至有可能减少对人类开发者的需求。但须注意到,该技术仍处于早期阶段,其成熟度和效果需要业界作进一步评估。
就目前而言,Devin的成功可以说为当今软件研发人员带来更新更好的AI协作体验。人们从繁琐工作中“解放”,只需监督AI系统去处理,而自己将精力投入到创新性任务上,实现生产力的真正提高。
10月31日,“科学家精神百场讲坛——国家卓越工程师进校园”在北京科技大学举行。
近日,记者跟随2024年“防震减灾高水平发展进行时”主题采访活动,了解江苏如何啃下海洋地震监测这块难啃的“硬骨头”。
为什么而科研?这是每一个科技工作人员和科研机构都需要回答的问题。是兴趣,是理想,亦是责任!
“天关”卫星(爱因斯坦探针卫星)在轨交付仪式暨成果发布会31日在中国科学院国家空间科学中心举行。
大科学装置不仅能帮助人类突破认知极限,在基础科学领域做出重大突破,也能服务社会持续健康发展,解决国家重大需求。
这项赛事由拼多多、光明食品集团、中国农业大学、浙江大学共同主办,旨在为植物工厂降本增效和产业化发展集智聚力。
这一私域大模型以在轨卫星管理专业知识库为基础,搭建航天器操控平台,通过语音、文本互动,就可以完成航天器在轨管理、航天器管理人员培训,助力卫星高效智能管理。
比赛中,残疾人选手将操纵义肢手抓取多种物体,但由于残疾人控制义肢的信号源非常有限,确保手指、手腕的可靠运动成为需要攻克的问题。
部分癌症发生在天生携带罕见基因序列变异的人群中,发现此类变异可改善早期癌症检测及促进靶向疗法发展。
10月下旬,西藏那曲市安多县三江源自然保护区唐北区域,温度已降至-10℃左右。“
吉林发现罕见东北红豆杉古树群 个体密度大、种群结构完整、有6株千年古树
近日,科研团队在开展古树名木调查过程中,在吉林省延边朝鲜族自治州和龙市境内的长白山原始森林中,发现大片以珍稀濒危植物东北红豆杉为骨干树种的天然群落。
从“首秀”“首展”看医疗领域前沿“黑科技”——进博会医疗器械及医药保健展区前瞻
今年进博会,医疗器械及医药保健展区将集聚全球十大医疗器械企业、十一家世界500强制药企业,大量“首秀”“首展”亮眼。
走进玉门风电场“风电长廊”展厅,一幅幅图片、一段段影像、一件件展品,详细的介绍了全球风电、中国风电、甘肃风电发展历程及现状。
美国一项新研究显示,一种关键洋流的减缓可能会在本世纪末使预计的北极变暖幅度下降约2摄氏度。研究人员还警告说,大西洋经向翻转环流减缓还可能引发其他气候异常,例如可能会引起热带辐合带的变化。
据了解,目前定位于高端、个性的冰箱,多使用智能玻璃面板,而中低价冰箱仍有不少是传统面板。
汽车后市场在规范化的基础上,借助智能化技术的赋能,正逐步实现服务的升级转型,为广大购买的人带来更加专业、便捷、个性化的服务体验。
新质生产力具有引领新一轮科技革命的质态特征。“人工智能+”作为新一代数字技术集合体,以数据、算法和算力为核心要素,驱动科技革命实现从孤岛走向连接、从初级走向高阶、从工具走向价值的全面升级,展现出超越工业经济时代的技术能级。
生成式AI在人机交互领域展现出的强大自主性和泛化能力,让人们越来越感觉到和AI的交流就像是和另一个人交谈。
科学普及是推动创新发展不可或缺的“一翼”,建设高水平科普人才队伍是壮大“科普之翼”的关键。我们始终相信,通过深入实施、逐渐完备这一制度,必将推动优秀科普人才持续涌现,为科学技术创新与科学普及“两翼齐飞”提供强劲动力。
上一篇:你最常用的AI东西是什么 2024抢手AI使用盘点 下一篇:轻松入门打造属于自身个人的虚拟数字人:几款AI制作软件推荐!