首个专为半导体行业设计的开源大模型 SemiKong 问世

作者 | 赵明华

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。

SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。

SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”

SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。

Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。

随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。

开源地址:https://github.com/aitomatic/semikong

SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”

Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”

参考链接:

https://www.prnewswire.com/news-releases/aitomatic-unveils-semikong-ai-breakthrough-set-to-reshape-500b-semiconductor-industry-302194215.html

https://www.semikong.ai/

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

剥离几百万行代码,复制核心算法去美国?TikTok 最新回应来了

微软偷偷决定不开源 Linux 及 macOS 版 WebView2,网友:等了四年,我还是用 Electron?!

大厂期权归属前遭暴力裁员,80 余万期权泡汤;去哪儿宣布每周两天“不坐班”;萝卜快跑是人类远程代驾?客服:无人操控 | Q资讯

微软中国 CTO 韦青:亲身经历大模型落地的体会与思考

相关推荐

  • 改善 Kubernetes 日志以增强可观测性
  • Construct 公司从 0 到 1 基于 Kitex+Istio 的微服务系统建设
  • 是时候重塑金融机构的思想结构与资产结构了
  • 入局大模型!值得开发者好好看一看的 AI 入门法!(内附教程)| 极客时间
  • 刚刚!苹果发布新款iPhone重大更新预览版,果粉测试方法来了
  • 无须英伟达,AMD本地可跑CUDA?惊现极客团队开发三方编程工具包,网友群议指责AMD无作为:已经晚了,CUDA已经是事实标准了
  • 神经网络架构「殊途同归」?ICML 2024论文:模型不同,但学习内容相同
  • VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格
  • Claude 3.5核心编码prompt揭秘,全网码农沸腾!四步调教法,最新V2版放出
  • 一枚「弃子」打破80年黎曼猜想纪录!菲尔兹奖得主MIT大拿联手,陶哲轩转赞
  • 提升准确率召回率的创新风控策略与算法
  • 图技术在金融反欺诈中的应用
  • 火山引擎基于 DataLeap 的电商指标管理实践
  • 抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法
  • 谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰
  • 公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4
  • 太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3
  • 全程免费!「真格星球AI+创业营」与十数位大咖导师一道,碰撞AI灵感、寻找落地商机
  • [Pnetlab实战演练]手把手教你配置华为防火墙的Telnet远程访问!
  • 从草稿到样品图,只需要一步AI|AI产品测评