吊炸了,OpenAI重磅推出o1模型

北京时间9月13日凌晨,OpenAI 正式发布了一系列全新 AI 大模型。在这次发布中,最先亮相的是该系列的首款模型——o1-preview,虽然目前仅为预览版,但已在 ChatGPT 和大模型 API 中上线使用。除此之外,OpenAI 还展示了即将推出的下一次更新的评估版本。OpenAI的研究负责人Jerry Tework在接受The Verge采访时透露,o1采用了全新的优化算法,并配备了专门设计的新训练数据集。因此,模型的命名并未沿用GPT系列的命名规则,而是称为“o1”,意为“将计数器重置为1”。而此次新模型的炸裂发布,一经问世就创造了很多历史纪录。相比 GPT-4o 有着巨幅提升,从有些回答一眼看去就是AI出品,到现在发布后,直接可以拿下数学奥赛金牌,并且能在科学问答环节上超越人类的博士专家。与以往的模型主要依赖“直觉”给出回答不同,o1通过引入“链式思考”(Chain-of-thought)机制,在回答前能先进行一套仿人类模式:深思熟虑。OpenAI研究主管Mark Chen:“模型在学习如何独立思考,而不是简单地模仿人类的思维方式。”天呐,想想就可怕,AI模型在学思考的过程,并且能给出更完美的展示成绩。也就是说,o1在给出答案之前,会经历一场“内部对话”,甚至会使用“让我想想”“我在考虑”等短语来展示其思考过程。这简直又是一个跨越式提升!
那么,o1的表现到底如何呢?了解一下PQA Diamond是一项评估化学、物理、生物等领域专业知识的测试。o1不仅顺利完成了测试,甚至超越了部分相关领域的博士级人类专家。这意味着什么,这意味AI一旦发展成熟,人类想要打败AI将是万中无一的可能。实验结果显示,o1也是成为首个在该基准测试中做到这一点的AI模型。这太惊人了!简而言之,o1是一个极具推理和思考能力的大模型。与基于“规模律”的传统大模型不同,o1并不依赖大规模计算消耗来提升性能,而是通过更为专注的方式提高表现。尽管o1展现了非凡的能力,但仍存在一些局限性。首先,在处理速度上,o1可能不如其他模型快速。其次,相较于GPT-4,o1在功能上还有一些不足——目前无法浏览网页,也无法处理文件和图像。此外,o1并不是一个多模态模型,意味着它无法解析图像或音频输入。不过,它已经非常非常优秀了。
在实践中,o1的推出让ChatGPT在回答问题前会更深入地思考,而不是立即给出答案。类似于人类大脑的“系统1”和“系统2”,ChatGPT从仅依赖快速、直观的系统1,进化到能够调用更慢、更有意识的系统2思维。这一进步让ChatGPT能够解决以往难以应对的问题。从用户体验来看,o1的推出可能在简单问题上不会显现太大差异,但对于复杂的数学或编程问题,用户会明显感受到不同。OpenAI官方也是特别建议将o1用于解决科学、编程、数学等复杂问题。还有,从今天起,ChatGPT Plus和Team用户可以访问o1-preview和o1-mini,而企业和教育用户将在下周获得访问权限。OpenAI计划为所有免费用户提供o1-mini的访问权限,但具体发布日期尚未确定。目前,ChatGPT Plus和Team用户可以手动选择使用o1-preview或o1-mini模型,不过每位用户每周只能发送30条消息给o1-preview,50条消息给o1-mini。虽然消息限制看似不多,OpenAI表示正在努力增加使用次数,并计划让ChatGPT能够自动根据提示词选择合适的模型。

未来除了模型更新之外,OpenAI还将增加网络浏览、文件和图像上传等功能,以让这些模型变得更加有用。

「除了新的 o1 系列模型,我们计划继续开发和发布我们的 GPT 系列模型。」

推荐一个AI小册子,扫码购买,只要10元。


军哥免费星球,欢迎有兴趣的朋友来聊聊,内容涵盖职场、副业、技术等等。

相关推荐

  • 如何打造一个属于前端人自己的知识库!
  • 不知道如何写出心仪的文字?来试试5分钟能写上万字论文这款AI论文助手!
  • 年仅34岁!985高校教授、博导突发心梗逝世
  • 全栈开发要掌握什么技术?
  • 干货:JavaScript代码优化技巧
  • 分享一款 最新可视化开发平台:GoVirw
  • 推理能力超博士,OpenAI发布最强模型o1
  • 来啦,传说中的 新模型终于来了,OpenAI o1 登场
  • 爆了!又一款高性能、无侵入的 Java 性能监控神器!
  • LLM 新范式:OpenAI o1,self-play RL 和 AGI 下半场
  • 面向软件工程的AI智能体最新进展,复旦、南洋理工、UIUC联合发布全面综述
  • 李彦宏内部讲话流出:曝大模型「刷榜」潜规则,谈三大认知误区
  • 简单测了一下 OpenAI o1-preview 。。。
  • [开源]企业级AI+微服务架构的快速开发平台,毫无保留可免费使用
  • Kaggle 赛题解析:Eedi 多项选择理解
  • 北京/新加坡内推 | 昆仑2050研究院颜水成团队招聘大模型研究实习生
  • ACL 2024 | 文本表示新SOTA!微软用大模型及其生成数据优化Text Embedding
  • 生成-理解大一统:一文浅谈多模态大模型最新研究进展
  • ChatGPT付费用户数突破1100万,每月创收2亿美元,OpenAI依然血亏
  • 国产最大MoE开源模型发布!腾讯AI Lab创始人带队,已融2亿美元