OpenAI神秘項目「草莓」曝光!自我进化已超越人类智能?马斯克嘲讽:回形针灾难

夕小瑶科技说 原创
作者 | 付奶茶
根据路透社的最新报道,OpenAI正在秘密开发代号为“草莓(Strawberry)”的全新项目!

根据路透社在五月份获得的OpenAI内部文件副本显示:虽然目前草莓项目的工作原理严格保密,但是OpenAI正在全力推动草莓项目的进行,项目目标在于利用草莓模型提升公司人工智能的推理能力,不仅能够生成查询的答案,还能够提前规划、自主地浏览互联网,并执行OpenAI称之为“深度研究”的复杂任务。

草莓项目的爆料

知情人士透露,草莓采用特殊的后训练技术(post-training,在模型经过大规模数据集预训练后进一步优化,使其在特定领域表现更加出色。

据爆料内容猜测,草莓与斯坦福大学 2022 年开发的一种名为 "自学推理"(Self-Taught Reasoner)或 "STaR "的方法有相似之处。其创造者之一 Noah Goodman 教授告诉路透社记者,STaR 能让 AI 模型通过反复创建自己的训练数据来 "引导"自己达到更高的智能水平,理论上可以用来让大语言模型超越人类智能水平。

STaR 相关的两篇论文:
论文题目
STaR: Bootstrapping Reasoning With Reasoning
论文链接:https://arxiv.org/pdf/2203.14465

论文题目
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
论文链接
https://arxiv.org/abs/2403.09629

推理是实现人工智能达到甚至超越人类智能水平的关键。尽管大型语言模型已经能够比人类更快速地总结复杂文本和撰写优雅散文,但在识别逻辑谬误和处理类似井字棋等直觉问题上,这项技术常常表现不佳。面对这类挑战时,模型往往会产生虚假信息的“幻觉”。

草莓项目被爆料为能够自主浏览互联网并进行“深度研究”,采用了CUA技术(Computer-Using Agent)。其主要目标是增强AI的推理能力,结合特殊的“后训练”方法,利用“深度研究”数据集来训练和评估模型。这种方法使得AI模型能够处理复杂的长期任务(LHT),提前规划并执行一系列操作。在接受Dwarkesh Patel的播客采访时,OpenAI的联合创始人之一John Schulman透露了关于这方面的最新进展。

播客链接:
https://www.youtube.com/watch?v=Wo95ob_s_NI

如果草莓项目和爆料的内容一致的话,其实可以是一个大语言模型研究进程上的一个关键转折点,它标志着我们正在从单纯依赖大规模数据和计算能力的方法,转向更注重AI系统内在推理能力和自主学习的新范式~

这么大的瓜,怎么少的了我们的知名网友呢~马斯克也赶来吃瓜了:

▲过去人们常说,AI灾难可能会像回形针一样成为问题。但现在看来,更可能是草莓田了。(这里引用了哲学家尼克·博斯特罗姆的观点,他曾提到,高度智能的AI可能会被设计成类似回形针,如果我们给人工智能一个看起来简单而无害的任务,如尽可能提高回形针的生产量,这种全能型的AI可能会采取极端措施,比如将地球上所有可用资源都转化为回形针生产,最终导致整个地球变成一个巨大的回形针制造工厂。)

这不得不提到,ChatGPT之前还有一个关于草莓(Strawberry)的笑话呢:

AGI 等级评价标准

除了草莓项目,OpenAI最近还有一个大新闻!

近日OpenAI举行了一次全员大会,推出了全球智能评分体系(AGI),并展示了接近人类推理能力的模型。在会上,OpenAI高管告知员工,目前ChatGPT已处于第一级阶段,但即将达到第二级,被称为“推理者”。

以下是全球智能评分体系(AGI)五级评分系统的标准:

第一级(Level 1, ChatBots):这类AI目前能够进行基本对话,如目前的ChatGPT。

第二级(Level 2, Reasoners):这级别的AI能够进行基本推理和问题解决,类似于拥有博士学位的人,且不依赖外部工具。

第三级(Level 3, Agents):这类AI能够在几天内代表用户执行任务,例如自动完成复杂工作流程。

第四级(Level 4, Innovations):这级别的AI不仅能完成任务,还能提出新的解决方案或发明创新。

第五级(Level 5, Organizations):最高级别的AI可以像一个组织一样运作,处理大量复杂任务,几乎可以完全替代人类在某些领域的工作。

奶茶对于这个分级没有异议,但是第五级的话,那我岂不是彻底失业了!!!如果给这个AGI进化历程加一个期限的话,我希望是一万年!!!

根据彭博的独家报道,一位OpenAI高管表示,目前正处第一级别,但预计很快将达到第二级别,即推理者。公司目前正在致力于在特定任务上实现博士级别的智能,预计可能在一年或一年半内实现~

参考资料

 [1]https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/
 [2]https://cointelegraph.com/news/openai-is-building-an-advanced-ai-tool-called-strawberry
 [3]https://www.youtube.com/watch?v=Wo95ob_s_NI

相关推荐

  • Mamba真比Transformer更优吗?Mamba原作者:两个都要!混合架构才是最优解
  • 已婚男子「出轨」AI女友,无法自拔!GPT-4o发布在即,年入十亿美金产业爆发
  • OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
  • GraphRAG科普长文推荐:知识图谱增强生成宣言,为通用人工智能注入知识
  • 端侧设备AI代理优化框架问世,领域内准确率可达97%
  • 豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性
  • Gemini 1.5 Pro装进机器人,参观一遍公司就能礼宾、带路
  • OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服
  • 大厂掀起视频生成「军备竞赛」,AI 真能干掉好莱坞?
  • 大模型中的Token,一文读懂
  • MSRA:视觉生成六大技术问题
  • 大模型剧本杀开源:6个Claude里藏一个凶手!刚上线服务器就被挤爆,免费免下载免注册
  • OpenAI新模型「草莓」曝光:强推理/长任务规划/超大规模训练!还给出AGI分级
  • Project Leyden 早期访问版本开放下载:Java 程序启动速度提升 2 至 3 倍
  • 金融数字化营销的“陷阱”与“出路” | 直播预告
  • 大型银行和中小银行眼中的“五篇大文章”有何不同?
  • 微软中国 CTO 韦青:亲身经历大模型落地的体会与思考
  • 干财务的学Python到底有没有用?
  • 实现一个直击用户灵魂的 Loading 效果(附源码)
  • 为消除幻觉,Amazon Bedrock开大招! 推出上下文基础和 RAG 连接器!