参战万亿MoE模型!上海大模型独角兽出手,腾讯阿里米哈游参投

abab 6.5系列模型会滚动更新到MiniMax旗下的产品中。编辑 |  ZeR0
智东西4月17日消息,今日,上海多模态大模型独角兽MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s两个模型。MiniMax成立于2023年1月,是当前国内估值最高的大模型公司之一。今年3月,MiniMax完成阿里参投的新一轮融资,投后估值超过25亿美元。此前米哈游、腾讯均有投资MiniMax。在MoE尚未成为行业共识时,MiniMax已经押注MoE路线,今年1月发布其首款基于MoE架构的abab 6,并在过去3个月潜心研发出性能更强的万亿参数MoE模型abab 6.5,在核心能力测试中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等顶尖大语言模型。

标注星号的是MiniMax调用API测试得到的结果,其余分数来自对应的技术报告。

abab 6.5abab 6.5s采用相同的训练技术、数据,支持200k tokens上下文长度。abab 6.5s更高效,1秒能处理近3万字的文本。

MiniMax在200k tokens内进行了业界常用的“大海捞针”测试。在891次测试中,abab 6.5均能正确回答。

MiniMax团队称找到了越来越多加速实现Scaling Laws的途径,包括改进模型架构、重构数据pipeline、训练算法及并行训练策略优化等。今天发布的abab 6.5和abab 6.5s是其加速Scaling Laws过程的阶段性成果。

abab 6.5系列模型会滚动更新到MiniMax旗下的产品中,包括生产力产品海螺AI和MiniMax开放平台上。


2024年中国生成式AI大会预告




相关推荐

  • 欧洲版OpenAI又要融资!估值50亿美元,Llama 2“套壳”也能半年估值翻番?
  • 天工3.0正式开放!4000亿参数MoE开源,开启音乐生成ChatGPT时刻
  • 今日代码大赏 | 懒汉式单例模式
  • 用 OJ 项目拿下鹅厂,真爽!
  • 跟自己之前的领导聊合作。。
  • 为什么现在的LLM都是Decoder only的架构?
  • 突破数据存储瓶颈!转转业财系统亿级数据存储优化实践
  • QQ 9“傻快傻快”的?!带你看看背后的技术秘密
  • 【研发效能·创享大会-嗨享技术轰趴】-IDCF五周年专场
  • 我调研了一下工业大数据中心用的组件
  • 19K Star大公司都在用的开源电子表格组件
  • 图解浏览器的各种距离
  • 小学生都开始学 Python 了!
  • OpenAI CEO:AI 成本可降至“接近零”;李飞飞团队发布《2024年人工智能指数报告》 | 极客头条
  • 又一个 GPT-4 级 LLM!前谷歌大脑成员初创公司官宣 Reka Core,多模态交互超越 Claude3 Opus
  • 有奖调查 | 2024 中国开发者大调查正式启动!
  • 想当“iPhone杀手”的首款 AI 硬件 Ai Pin 意外“翻车”:看时间似乎成为它唯一正确可做的事情!
  • 买了小米 SU7 ,被公司强制开除!
  • 让玩家全程掌控游戏:自然语言指令驱动的游戏引擎到来了
  • 无向图最小割问题取得新突破,谷歌研究获SODA 2024最佳论文奖