北京时间9月13日凌晨,OpenAI 正式发布了一系列全新 AI 大模型。在这次发布中,最先亮相的是该系列的首款模型——o1-preview,虽然目前仅为预览版,但已在 ChatGPT 和大模型 API 中上线使用。除此之外,OpenAI 还展示了即将推出的下一次更新的评估版本。OpenAI的研究负责人Jerry Tework在接受The Verge采访时透露,o1采用了全新的优化算法,并配备了专门设计的新训练数据集。因此,模型的命名并未沿用GPT系列的命名规则,而是称为“o1”,意为“将计数器重置为1”。而此次新模型的炸裂发布,一经问世就创造了很多历史纪录。相比 GPT-4o 有着巨幅提升,从有些回答一眼看去就是AI出品,到现在发布后,直接可以拿下数学奥赛金牌,并且能在科学问答环节上超越人类的博士专家。与以往的模型主要依赖“直觉”给出回答不同,o1通过引入“链式思考”(Chain-of-thought)机制,在回答前能先进行一套仿人类模式:深思熟虑。OpenAI研究主管Mark Chen:“模型在学习如何独立思考,而不是简单地模仿人类的思维方式。”天呐,想想就可怕,AI模型在学思考的过程,并且能给出更完美的展示成绩。也就是说,o1在给出答案之前,会经历一场“内部对话”,甚至会使用“让我想想”“我在考虑”等短语来展示其思考过程。这简直又是一个跨越式提升!
那么,o1的表现到底如何呢?了解一下PQA Diamond是一项评估化学、物理、生物等领域专业知识的测试。o1不仅顺利完成了测试,甚至超越了部分相关领域的博士级人类专家。这意味着什么,这意味AI一旦发展成熟,人类想要打败AI将是万中无一的可能。实验结果显示,o1也是成为首个在该基准测试中做到这一点的AI模型。这太惊人了!简而言之,o1是一个极具推理和思考能力的大模型。与基于“规模律”的传统大模型不同,o1并不依赖大规模计算消耗来提升性能,而是通过更为专注的方式提高表现。尽管o1展现了非凡的能力,但仍存在一些局限性。首先,在处理速度上,o1可能不如其他模型快速。其次,相较于GPT-4,o1在功能上还有一些不足——目前无法浏览网页,也无法处理文件和图像。此外,o1并不是一个多模态模型,意味着它无法解析图像或音频输入。不过,它已经非常非常优秀了。
在实践中,o1的推出让ChatGPT在回答问题前会更深入地思考,而不是立即给出答案。类似于人类大脑的“系统1”和“系统2”,ChatGPT从仅依赖快速、直观的系统1,进化到能够调用更慢、更有意识的系统2思维。这一进步让ChatGPT能够解决以往难以应对的问题。从用户体验来看,o1的推出可能在简单问题上不会显现太大差异,但对于复杂的数学或编程问题,用户会明显感受到不同。OpenAI官方也是特别建议将o1用于解决科学、编程、数学等复杂问题。还有,从今天起,ChatGPT Plus和Team用户可以访问o1-preview和o1-mini,而企业和教育用户将在下周获得访问权限。OpenAI计划为所有免费用户提供o1-mini的访问权限,但具体发布日期尚未确定。目前,ChatGPT Plus和Team用户可以手动选择使用o1-preview或o1-mini模型,不过每位用户每周只能发送30条消息给o1-preview,50条消息给o1-mini。虽然消息限制看似不多,OpenAI表示正在努力增加使用次数,并计划让ChatGPT能够自动根据提示词选择合适的模型。
未来除了模型更新之外,OpenAI还将增加网络浏览、文件和图像上传等功能,以让这些模型变得更加有用。
「除了新的 o1 系列模型,我们计划继续开发和发布我们的 GPT 系列模型。」
推荐一个AI小册子,扫码购买,只要10元。
军哥免费星球,欢迎有兴趣的朋友来聊聊,内容涵盖职场、副业、技术等等。