简单测了一下 OpenAI o1-preview 。。。


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。转载自 | AINLP

一早起来,发现到处是OpenAI o1的信息,邮箱里还躺着OpenAI的这份邮件:

Hi there,


Today we announced our new series of models, OpenAI o1. We’ve developed these models to spend more time thinking before they respond. They can reason through complex tasks and solve harder problems than previous models in science, coding, and math. Read more in our blog post.

You can try the o1 beta in ChatGPT Plus. We’re rolling out two models:

  • Our larger model, o1-preview, which has strong reasoning capabilities and broad world knowledge.

  • Our smaller model, o1-mini, which is faster and is competitive with o1-preview at coding tasks (you can see how it performs here).

These models aren’t available in the API for your account while we’re in this short beta period. (Developers on usage tier 5 will have access, but we’ll expand access to more tiers.) We’re continuing to improve o1 and we’ll be in touch as soon as it’s available to you in the API.

Best,
The OpenAI team


让chatgpt自己翻译了一下:

你好,

今天我们宣布了我们的新系列模型,OpenAI o1。我们开发这些模型是为了在回应前进行更多思考。它们可以通过复杂的任务进行推理,并解决比以往模型在科学、编程和数学方面更难的问题。更多信息请阅读我们的博客文章。

你可以在ChatGPT Plus中尝试o1 beta版。我们正在推出两个模型:

我们的大型模型,o1-preview,具有强大的推理能力和广泛的世界知识。我们的小型模型,o1-mini,速度更快,在编程任务上与o1-preview具有竞争力(你可以在这里看到它的表现)。

在这个短暂的beta测试期间,这些模型在你的账户的API中是不可用的。(第5层的开发者将有权限访问,但我们将扩大到更多层次的访问权限。)我们正在持续改进o1模型,并将在它在API中向你提供使用时与你联系。

最好的祝愿, OpenAI团队

幸好我的Plus账号还在,赶紧试用了一下,模型是ChatGPT o1-preview:

直接问“9.11和9.8谁大”的问题还是挂了,但是问了一下为什么之后自我纠正过来了。

又问了一道小朋友的小学数学题,之前暑假问过GPT4,修正了一次勉强答对:

这次拿来重新问一下ChatGPT o1-preview:

回答的逻辑还是比较清晰的,看来这次确实提升了复杂任务的推理能力,我继续测测。更多关于 OpenAI o1的信息,感兴趣的朋友可以看看今天推送的其他相关文章.


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向(如:小张-哈工大-对话系统)即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

相关推荐

  • [开源]企业级AI+微服务架构的快速开发平台,毫无保留可免费使用
  • Kaggle 赛题解析:Eedi 多项选择理解
  • 北京/新加坡内推 | 昆仑2050研究院颜水成团队招聘大模型研究实习生
  • ACL 2024 | 文本表示新SOTA!微软用大模型及其生成数据优化Text Embedding
  • 生成-理解大一统:一文浅谈多模态大模型最新研究进展
  • ChatGPT付费用户数突破1100万,每月创收2亿美元,OpenAI依然血亏
  • 国产最大MoE开源模型发布!腾讯AI Lab创始人带队,已融2亿美元
  • 太能写了!体验完夸克CueMe智能助手,我想说其他AI写作工具可以弃了
  • 解锁双车道 !!! 你还说485不能全双工 ???
  • 18K Star 超级编辑器 !!! 别再羡慕别人的IDE了
  • Cursor 完全使用教程
  • Spring Boot集成Akka Stream快速入门Demo
  • Pytorch 常用损失函数拆解
  • 苹果为什么不敢对 12306 买票抽成 30% ?
  • 第一批00后,已经开始让AI给自己打工了
  • Python网页应用开发神器Dash 2.18.1稳定版本来啦
  • Git 客户端新选择:腾讯自研的 UGit
  • 阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%
  • SpaceX再创历史,人类首次商业太空行走成就达成!
  • 字节AI版小李子一开口:黄风岭,八百里