吊炸了，OpenAI重磅推出o1模型

北京时间9月13日凌晨，OpenAI 正式发布了一系列全新 AI 大模型。

在这次发布中，最先亮相的是该系列的首款模型——o1-preview，虽然目前仅为预览版，但已在 ChatGPT 和大模型 API 中上线使用。除此之外，OpenAI 还展示了即将推出的下一次更新的评估版本。OpenAI的研究负责人Jerry Tework在接受The Verge采访时透露，o1采用了全新的优化算法，并配备了专门设计的新训练数据集。因此，模型的命名并未沿用GPT系列的命名规则，而是称为“o1”，意为“将计数器重置为1”。而此次新模型的炸裂发布，一经问世就创造了很多历史纪录。相比 GPT-4o 有着巨幅提升，从有些回答一眼看去就是AI出品，到现在发布后，直接可以拿下数学奥赛金牌，并且能在科学问答环节上超越人类的博士专家。

与以往的模型主要依赖“直觉”给出回答不同，o1通过引入“链式思考”（Chain-of-thought）机制，在回答前能先进行一套仿人类模式：深思熟虑。OpenAI研究主管Mark Chen：“模型在学习如何独立思考，而不是简单地模仿人类的思维方式。”天呐，想想就可怕，AI模型在学思考的过程，并且能给出更完美的展示成绩。也就是说，o1在给出答案之前，会经历一场“内部对话”，甚至会使用“让我想想”“我在考虑”等短语来展示其思考过程。这简直又是一个跨越式提升！

那么，o1的表现到底如何呢？

了解一下PQA Diamond是一项评估化学、物理、生物等领域专业知识的测试。o1不仅顺利完成了测试，甚至超越了部分相关领域的博士级人类专家。这意味着什么，这意味AI一旦发展成熟，人类想要打败AI将是万中无一的可能。实验结果显示，o1也是成为首个在该基准测试中做到这一点的AI模型。这太惊人了！

简而言之，o1是一个极具推理和思考能力的大模型。与基于“规模律”的传统大模型不同，o1并不依赖大规模计算消耗来提升性能，而是通过更为专注的方式提高表现。尽管o1展现了非凡的能力，但仍存在一些局限性。首先，在处理速度上，o1可能不如其他模型快速。其次，相较于GPT-4，o1在功能上还有一些不足——目前无法浏览网页，也无法处理文件和图像。此外，o1并不是一个多模态模型，意味着它无法解析图像或音频输入。不过，它已经非常非常优秀了。
在实践中，o1的推出让ChatGPT在回答问题前会更深入地思考，而不是立即给出答案。类似于人类大脑的“系统1”和“系统2”，ChatGPT从仅依赖快速、直观的系统1，进化到能够调用更慢、更有意识的系统2思维。这一进步让ChatGPT能够解决以往难以应对的问题。从用户体验来看，o1的推出可能在简单问题上不会显现太大差异，但对于复杂的数学或编程问题，用户会明显感受到不同。OpenAI官方也是特别建议将o1用于解决科学、编程、数学等复杂问题。还有，从今天起，ChatGPT Plus和Team用户可以访问o1-preview和o1-mini，而企业和教育用户将在下周获得访问权限。OpenAI计划为所有免费用户提供o1-mini的访问权限，但具体发布日期尚未确定。

目前，ChatGPT Plus和Team用户可以手动选择使用o1-preview或o1-mini模型，不过每位用户每周只能发送30条消息给o1-preview，50条消息给o1-mini。虽然消息限制看似不多，OpenAI表示正在努力增加使用次数，并计划让ChatGPT能够自动根据提示词选择合适的模型。

未来除了模型更新之外，OpenAI还将增加网络浏览、文件和图像上传等功能，以让这些模型变得更加有用。

「除了新的 o1 系列模型，我们计划继续开发和发布我们的 GPT 系列模型。」

推荐一个AI小册子，扫码购买，只要10元。

军哥免费星球，欢迎有兴趣的朋友来聊聊，内容涵盖职场、副业、技术等等。

吊炸了，OpenAI重磅推出o1模型

相关推荐