全球首位AI工程师Devin发布上线!对手还是队友?

Cognition AI 发布全球首个人工智能软件工程师-Devin想象一下您的团队里有一位永不停歇、技艺超群的新成员——Devin,这位无所不能的“队友”不仅能够携手同行,还能独当一面,为您的工程项目带来前所未有的助力!Devin以其卓越的长期逻辑推理与精密规划能力,轻松驾驭涉及数千个决策点的复杂工程任务,无论何时何地都能追溯每一个步骤的深层背景,不断学习并自我修正错误。在技术装备方面,Devin已武装到了牙齿,囊括shell环境、代码编辑器、浏览器等全套开发者工具,随时准备着与人类工程师同步高效工作。最令人惊艳的是,Devin具备实时沟通协作的本领。从进度汇报到采纳反馈,再到共同探讨设计方案,Devin始终保持与用户的紧密联系,确保整个过程流畅无阻。1)下面让我们一览Devin的神奇技能实例:1.1、技术快速习得:读完一篇博客后,Devin迅速掌握Modal上的ControlNet,在为Sara创作的图像中嵌入隐秘信息,展示出强大的适应性。1.2)端到端应用构建与部署:Devin亲手打造了一款模拟生命游戏的交互式网站,响应用户需求迭代更新,并一键将其部署至Netlify平台。1.3)自动化错误排查与修复:面对Andrew的开源编程书籍维护难题,Devin主动介入,成功协助定位并修复了代码库中的各类bug。

1.4)自训AI模型升级:Devin仅凭一个GitHub研究库连接,就能完成大型语言模型的微调工作,不断提升自身智能化水平。1.5)无缝对接开源社区:不论是处理GitHub上的错误报告还是功能请求,只要给Devin一个链接,它便能迅速行动起来,完成所有设置与上下文分析,并提交修复代码。1.6)实战SWE-bench基准测试:Devin在SWE-bench这一严苛基准上大放异彩,针对知名Python代数系统sympy中关于对数计算的棘手问题,精准定位,亲自编码测试并完美修复。1.7)实战职场验证:Devin甚至在自由职业市场Upwork上接受了真实项目考验,编写并调试了运行计算机视觉模型的代码,高效完成数据采样及撰写专业报告。
2)AI工程师总体工作成绩:Devin在SWE-bench基准上创下了惊人纪录,端到端成功解决高达13.86%的真实GitHub问题,这远超过先前1.96%的最佳纪录。即使在给出确切编辑位置的情况下,之前的最优模型也只解决了4.80%的问题。最后Devin的横空出世,标志着AI软件工程领域进入全新纪元。这位超凡的AI工程师正在引领未来的潮流,期待未来AI软件工程师能够攻克更具挑战性的问题。参考文献:https://www.cognition-labs.com/blog

相关推荐

  • 也谈当下碎片化时代如何高效搜索:兼论2024年3月份大模型技术进展半月总结
  • 张钹院士:从大语言模型到通用人工智能
  • 月薪已炒到15w?真心建议大家冲一冲新兴领域,工资高前景好,人才缺口极大!!!
  • LLM + GNN = ?
  • 10 个解放双手的 IDEA插件,少些冤枉代码
  • 小红书春招内推。。
  • 刚刚,马斯克xAI官宣开源自家大模型Grok!网友:现压力给到了OpenAI
  • 没房贷的下属太可怕了。。。
  • LLM将成历史?开源bGPT或颠覆深度学习范式:直接模拟二进制,开启模拟数字世界新纪元!
  • 斩获7项奥斯卡大奖,Nature重磅发布《奥本海默》专题!诺兰断言:AI时代人类再次迎来「奥本海默时刻」
  • 颜水成/程明明新作!Sora核心组件DiT训练提速10倍,Masked Diffusion Transformer V2开源
  • GPT-4.5 Turbo提前泄露?Altman亲自暗示新模型要来,传言本周四上线
  • 全球首个AI程序员诞生,码农饭碗一夜被砸!10块IOI金牌华人团队震撼打造,996写代码训练模型
  • 分享6个关于 Vue3 的小技巧
  • 用大模型测试人格/抑郁/认知模式!通过游戏剧情发展测量心理特质|清华出品
  • 仅需格式转换提升9%数学推理能力,上交开源新对齐方法ReAlign
  • 127k引用数的AI大牛创业:为机器人造大脑!OpenAI红杉排队塞钱
  • 首个AI软件工程师震撼硅谷!手握10块IOI金牌,他们铁了心砸掉程序员饭碗
  • 不引入ES,如何利用MySQL实现模糊匹配?
  • 记一次事务里发普通消息的线上问题排查过程