▲Mistral AI发布Mixtral 8x22B
Mixtral 8x22B由8个专家模型构成,每个模型的参数规模220亿,模型文件大小约为262GB。测评成绩方面,Mixtral 8x22B在MMLU(大规模多任务语言理解)登顶开源模型榜首,Hellaswag、TruthfulQA、GSM8K等多项测评成绩超越Llama 2 70B、GPT-3.5以及Claude 3 Sonnet。这是近日继OpenAI的视觉版GPT-4 Turbo和谷歌的Gemini 1.5 Pro全面更新后,大模型厂商们发布的第三个重要型号。此外,Meta还暗示将在下个月发布Llama 3。推荐智东西年度会议。4月18-19日,2024中国生成式AI大会将在北京举行。免费报名或购票通道开放中,期待你的参会~▲Mixtral 8x22B测评成绩
虽然发布方式低调,但Mixtral 8x22B再一次引爆了开源社区。AI搜索平台Perplexity Labs和开源平台Together AI都迅速提供了该模型的支持。AI科学家贾扬清称,通过合理的量化,Mixtral 8x22B可在4个A100/H100显卡上运行,严格来说,其实3张A100显卡就够了。▲贾扬清称3张A100显卡可以跑Mixtral 8x22B
苹果机器学习研究员Awni Hannun称,Mixtral 8x22B模型在苹果机器学习框架MLX上使用M2 Ultra芯片运行良好,并发布了MLX社区中的4位量化模型。▲苹果机器学习框架MLX运行Mixtral 8x22B
▲杨立昆转发Damien Henry帖文
2013年,Xavier Niel创办了计算机培训学校Ecole 42,这所不同寻常的学校接收来自不同背景的学生,以点对点学习的方式培训编程。2015年,杨立昆创办了FAIR Paris,也就是FacebookAI研究院。他被公认为深度学习的三大发明者之一,另外两位是加拿大人。FAIR向法国人才发出了一个信号:他们不必离开法国就可以从事深度学习研究;也向美国其他科技巨头发出信号:在法国进行科学研究是可行的。之后在2018年,谷歌DeepMind也在巴黎开设了一家实验室。2016年,第一届VivaTech举办,它成为欧盟首屈一指的初创企业和投资者盛会,吸引了超过2400家初创企业和超过2000名投资者。同年,开源社区Hugging Face在法国成立。也许当时的他们不会知道,其Transformer库不久之后就会成为行业标准。2017年,Xavier Niel成立了STATION F,这是世界上最大的创业园区。在Roxanne Varza的带领下,它成为了法国的科技中心。值得一提的是,Hugging Face是首批加入STATION F计划的创企之一,也是该计划诞生的首个独角兽。▲STATION F创业园区
2018年,杨立昆获得图灵奖,成为AI领域最具影响力的人物之一。▲杨立昆
在此期间,这篇帖文的作者Damien Henry在巴黎组建了Google Arts&Culture团队,专注于AI和图像。他还和其他两位联创共同创建了AI视觉生成工具Clipdrop,后被Stability AI收购。2019年,巴黎已经在世界AI地图上占据一席之地,但并不像如今一样成为主流。但在2020年,疫情席卷了全球,远程办公成为常态。这让科技界开始转移阵地:世界上有这么多地方可供选择,我为什么非要在硅谷租房?此外,美国人开始逐渐把科技发展视为一种威胁,而大多数科技没那么发达的国家则恰恰相反。2021年,Hugging Face迅速增长,成为如今我们熟知的最强开源AI平台。深度科技在全球范围内加速发展,而在巴黎尤为迅速。2023年Mistral AI成立,并在几个月内就飞速成长为OpenAI的最大劲敌之一。他们发布模型的方式低调又“激进”,仅凭一条没有任何背景信息磁力链接就获得超400万次浏览量,让昂贵的发布视频变得过时。同年,欧洲首个独立AI研究实验室kyutai成立,Scaleway、Rodolphe Saade等宣布进入计算领域,要为欧洲带来更多GPU。计算机视觉国际顶级会议ICCV也选择在巴黎举办,红衫资本等顶级投资机构也越来越多地将目光放到法国AI创企。2024年中国生成式AI大会预告