微软前全球副总裁入局AGI:左手效率神器、右手AI开放世界,实测好用!

微软大牛下场创业,“铁人四项”进击AGI。作者 |  三北
编辑 |  漠影
大模型进入创业爆发期,来自全球大厂的离职AI大牛成为一大主力军,近期圈内热门的阶跃星辰是一个典型代表。成立于2023年4月的阶跃星辰,是由原微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创办的通用大模型创业公司。这是一个“卧虎藏龙”的团队:创始人、CEO姜大昕是自然语言处理领域的全球知名专家,也是阶跃星辰的算法负责人;系统负责人朱亦博曾在谷歌、字节和微软等公司就职,拥有多次单集群万卡以上的系统建设与管理实践经验;数据负责人焦斌星此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量……基于这样的团队背景,阶跃星辰仅花了一年时间就憋出“大招”。今年3月23日,阶跃星辰推出Step系列通用大模型,打响国产玩家进击万亿参数规模通用大模型的响亮一枪。同时,阶跃星辰的两款C端产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”已经全面开放,在巨头云集的“百模大战”中撕开一道新口子。创业一年来,阶跃星辰对大模型产业有什么独到见解?其推出的大模型的实际体验效果如何?智东西来与读者一起一探究竟。跃问体验地址:
https://stepchat.cn/chats/new
冒泡鸭体验地址:
https://maopaoya.com/discover

01.微软大牛下场创业
“铁人四项”进击AGI


按照阶跃星辰的理念,大模型的演化路径会经历“从各模态独立发展、到融合统一、再到主动探索物理世界”的三个阶段。姜大昕在此前的媒体沟通会上表示,阶跃星辰正处在多种模态走向融合的第二阶段。姜大昕认为,多模理解和生成的统一是通向AGI的必经之路。原因有两个:第一,多模理解是多模生成的坚实基础。Sora在视频生成领域的惊艳表现,正是因为OpenAI有非常出色的多模理解模型GPT-4V。第二,多模理解做得好,也证明了模型在LLM方面的能力优秀。正如GPT-4V的基础是GPT-4。

Scaling law是阶跃星辰在追逐AGI路上与多模态齐头并进的方向,为此其提出“铁人四项”,算力、系统、数据和算法四大要素缺一不可。在姜大昕看来,能够自己从头训练千亿参数模型已经是个不低的门槛,而在千亿之后,每增长一个数量级,面临的挑战却是几十倍的增长。因此,能否对这四大要素进行综合布局,非常考验一家创业公司的能力,也决定了这家公司能走多远。

▲阶跃星辰创始人姜大昕在讲解攀登Scaling law所需的要素


02.左手效率神器、右手开放世界平台
实测两款AI产品


基于多模态和Scaling law两大路线,阶跃星辰推出了Step系列大模型。Step-1千亿参数语言大模型于2023年8月底训练完成。经过充分准备,Step-1大模型的进展非常快,用时2个月一次性训练成功,综合性能超过GPT-3.5。Step-1V千亿参数多模态大模型于2023年11月训练完成。Step-1V在多个主流评测集上性能指标比肩GPT-4V。特别是在多模理解能力上达到全球领先水平。Step-1V大模型可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。Step-2万亿参数语言大模型采用MoE架构,每Token激活两千亿以上参数,聚焦模型深度智能水平的探索,综合体感对标GPT-4,目前已发布预览版。围绕Step-1和Step-1V千亿参数大模型,阶跃星辰的产品和生态已经初步打磨成熟。以跃问为例,其在图像理解、内容创作、逻辑推理、指令跟随等方面的能力,使其成为一个出色的“个人效率助手”。

比如,当智东西发给跃问一篇报道链接,跃问立马为我提炼了报道中的关键数据和信息点。

当智东西给它一张关于“A公司营业收入与毛利、净利”的统计图,并要求其“将图中的内容转成表格形式,并计算每年净利增长率”。跃问迅速生成了表格,并算出了9.54%、2.72%两个图中没有直接给出的答案,体现了强大读图、数学、组建联动能力。

通过点击展开“代码执行完成”,智东西追溯了计算过程,确认两个数值计算正确。

当智东西给跃问一张菜肴的图片,跃问则准确地识别了这是一道经典的湖南菜“辣椒炒肉”,并给出了烹饪所需的材料和烹饪步骤。可见跃问的常识知识还是很丰富的,可以做不错的日常助手。

再看看冒泡鸭,这是一个由剧情和角色组成的AI开放世界平台,能满足多种娱乐和社交需求。

以逃离精神病院Agent为例,这是一个有趣的心理学游戏,我需要通过与“兔子医生”的对话,找到逃离精神病院办法。而逃出这里的唯一方法,是成为一个真正的病人。这一游戏获得了超5.6万的热度。

跃问和冒泡鸭只是Step系列大模型的小试牛刀。为了促进Step系列大模型应用生态的繁荣,在生态布局方面,阶跃星辰与合作伙伴共同探索面向C端用户的创新应用,API开放平台目前已开放体验。
03.结语:大厂牛人纷纷“下海”
掀起AI创业潮


纵观产业,当下大厂牛人纷纷“下海”投身大模型创业,掀起一波新的AI创业潮。创业方向也展现出百花齐放的态势,通用大模型创业成为一个值得关注的前沿方向。尤其是今年Sora的出现,让我们看到基座模型在迭代细分模型应用上的效率和效果,坚定了通用大模型创业的发展路径。

(本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。)

2024年中国生成式AI大会预告




相关推荐

  • 对话国产“算力黑马”:27亿元大单背后,英博数科周韡韡的AGI探索之路
  • 街边的普通茶室也能赚600万,靠的不只是喝茶
  • 探探各个微前端框架
  • 前端代码规范 - 代码注释
  • 从商品图到海报生成 京东广告AIGC创意技术应用
  • 工科博士毕业去高校还是去研究所?
  • 今天是新模型发布大赛:Gemini 1.5 Pro发完,GPT-4-Turbo发,Mistral AI继续发……
  • 库存管理系统开源啦
  • 2.5K Star开源论坛!谁说Python只能写脚本工具
  • 小红书搜索团队提出新解码策略,降低大模型推理成本
  • 你真的知道 NPM、Yarn 与 PNPM 这三个前端包管理器之间的区别吗?
  • 4月10号马云的全员信,马云退休五年后首次发长文
  • 宇航员为什么使用Linux?
  • 开源流量回放平台AREX在携程的大规模落地实践
  • 老乡鸡“开源”了
  • 世界上最好的编程语言——PHP排名跌至历史最低
  • 提升数据安全与性能,掌握Helm一键部署MySQL 8.0主从技巧
  • 深圳团队研发的编程语言 MoonBit 在日本知名开发者社区 Zenn 爆火
  • 网易暴雪官宣合作;马云内部发帖肯定阿里一年改革;Android Studio整合Gemini 1.0 Pro | 极客头条
  • OpenAI 发布全新 GPT-4 Turbo with Vision,网友实测:编码不如旧版本!