为什么ChatGPT等AI大模型都是基于Python开发?

知乎上有个问题比较火,国内主流AI大模型都是Python 开发的,国外AI大模型是什么语言开发的?为什么要用python?

有个很简单的方法可以看开源的AI工具主要用哪种编程语言,你只需要去Github看这个AI项目仓库基础信息,它会标出来主要基于哪种语言开发的。

Github会综合分析仓库中文件扩展名、代码、主要内容等来自动确定主要是哪种编程语言。

打开Openai在Github的账号,有将近200个项目仓库,你会发现几乎90%的仓库都是主要基于Python开发的,尽管也会有其他语言代码,但Python贡献了多数代码。

下面举几个例子:

gpt2: 无监督多任务学习语言模型论文的代码

DALL-E: Open AI的图像生成产品,类似midjourney

whisper: Openai的语音识别转换产品

其他还有很多仓库都是以Python语言为主

不只是OpenAI,其实大多数知名AI公司产品都是主要基于Python,比如创造了阿尔法狗的Deepmind,你去翻看它的Github仓库,也是同样情况

到底为什么AI产品都主要基于Python进行开发?

我们知道AI主要是基于机器学习、深度学习、神经网络等技术,因此对计算、算法要求很高,需要专业的AI库来支持开发,比如谷歌的Tensorflow、Facebook的Pytorch和Caffe、百度的PaddlePaddle等等,还有像numpy、scipy等底层计算库,是AI训练不可或缺的工具。

这些用来跑AI算法的库都是在Python生态中构建的,虽然底层代码会有C、C++等语言,但封装、使用、接口、维护等主要依靠Python来实现,所以你会发现几乎所有AI产品都是主要基于Python开发。

如果说数据和算力是AI的弹药,那么python及其所拥有的第三方库生态则为AI提供了发射弹药的火箭筒。

这是表面上的原因,而深层次的原因是python足够简单易用,具有胶水属性,且跨平台通用性好,为融合Ai工具提供了底层能力,也让算法工程师们花最少的代码时间创造出最大的价值,这是其他语言所没法比拟的。

加入知识星球【我们谈论数据科学】

600+小伙伴一起学习!



相关推荐

  • 游戏账号的订单流程重构之路
  • 传Stability AI核心技术团队集体离职;Sora复现项目Mora发布;三星明年推出AI芯片Mach-1丨AIGC大事日报
  • 现场采访黄仁勋:20个灵魂问题,谈GPU定价和中国出口,怼AGI时间表
  • 张勇 × 刘晓丹,顶峰相见| 底片
  • 12条SQL不起眼的数仓调优技巧
  • 洗一次68元,单月成交总额能做到6500万,搞钱就是要做复利的事情
  • 用大语言模型控制交通信号灯,有效缓解拥堵!
  • 今日arXiv最热NLP大模型论文:华东师大发布对话级大模型幻觉评价基准DiaHalu
  • 超越 GPT-4V 和 Gemini Pro!HyperGAI 发布最新多模态大模型 HPT,已开源
  • 【收藏】GTC2024必看演讲|对话视频系列 · 之一
  • Beyond Compare! Rust Vs Js
  • 招募200名互联网运营师,不限经验,男女可报!居家办公!
  • [开源]MIT开源协议,智慧协同办公OA,企业级协同办公整体解决方案
  • 每日 prompt:黑猫手机壁纸
  • 黄仁勋的GTC大会集齐 Transformer 论文七大作者
  • 工厂数字化系统是自研?还是对外采购?
  • 3.8K Star小众Dart实现的键鼠输入可视化软件
  • 大模型时代,5个最顶级的向量数据库
  • Android玩家折腾不动了
  • Oracle正式发布Java 22