“AI届汪峰”谷歌的Astra是强势反击GPT-4o，还是又被抢了风头？

夕小瑶科技说原创
作者 | Zicy

在5月15号凌晨的一年一度的“谷歌科技春晚”，即Google I/O开发者大会上，110分钟的发布会中，“AI”这个词被提及了121次。

目前，大模型竞争已经进入白热化阶段，本次开发者大会自然也围绕AI这一关键词展开。期间，Google宣布了一系列新的重大举措，其中最受关注的是实时语音助手Project Astra，对标OpenAI的GPT-4o。

但这次的Project Astra却再一次遭遇了OpenAI的“贴脸输出”。在本月的月初，一直有消息称5月9号OpenAI会举办一场发布会，但是最后又被推迟。时间好巧不巧，恰好推迟到Google I/O 开发者大会的前24小时，5月14号的凌晨。于是提前Project Astra 24小时，OpenAI率先发布了自己的实时语音助手GPT-4o，先抢占了一波热度。

但类似的事情不是第一次发生，早在今年2月，Google发布了Gemini 1.5 Pro，可以支持1M上下文的token，相比之下GPT-4 Turbo也仅支持128K上下文，但是OpenAI随后发布了文生视频模型Sora，直接吸走了一大波热度。

这下“AI届汪峰”的名号坐实了，任谁看了不得不说一句，高端的商战往往采取朴素的方式。

话虽这么说，但是Project Astra和GPT-4o的实际性能对比如何呢？

Project Astra vs GPT-4o

目前没有关于两个模型对比的明确指标，但是我们可以先从官方的demo中看个大概，Project Astra不但能和人类流畅交流，甚至能直接通过摄像头帮忙读代码。

Google的CBO Philipp Schindler也在推特上放出了一段在他的办公室录制的视频。

更牛的是，Astra能记住他所看到的东西。

对比之前GPT-4o在发布会上的表现

编者表达一下自己的看法，两者各有各的优点，似乎Project Astra具有更长的上下文能力，而且Google具有自己的硬件优势，在第一个demo结尾展示了将增强现实和人工智能的完美结合（边撸狗边和AI对话）。

但GPT-4o在情感上更加丰富，而且GPT-4o的交互更加流畅，延迟更低。GPT-4o的流畅可能是因为其模型结构更加精简，这意味着需要更少的算力，这可能就更加方便市场化的应用。

这两个突如其来的大动作，网友也是纷纷表示震惊

Project Astra这次是强势反击还是又被抢了风头？目前，关于Project Astra的性能指标，比如生成质量，数学能力和推理能力还尚未公开，但从demo演示上，似乎是与GPT-4o不相上下。未来随着更多性能指标的公开和用户反馈的积累，或许我们可以更全面地了解这两款AI模型的真正实力。

参考资料

[1]https://deepmind.google/technologies/gemini/project-astra/
[2]https://twitter.com/GoogleDeepMind

“AI届汪峰”谷歌的Astra是强势反击GPT-4o，还是又被抢了风头？

Project Astra vs GPT-4o

参考资料

相关推荐