专为 Excel 而生!微软推出新 AI 模型,网友:会计师和数据分析师,危?

整理 | 郑丽媛
出品 | CSDN(ID:CSDNnews)

继作家、画家、程序员担忧被 AI 取代后,微软近日最新推出的一个新的 AI 模型,可能会让会计师和数据分析师也开始感到紧张了。

上周末,微软在 arXiv 上悄然发表了一篇题为“SpreadsheetLLM: Encoding Spreadsheet for Large Language Models”的研究论文,首次揭示了 SpreadsheetLLM 的相关细节:这个新模型“在各种电子表格任务中都非常有效”,甚至“有可能改变电子表格数据管理和分析的方式”。

在论文中,研究人员首先强调了电子表格在商业世界中的普遍性和重要性,指出电子表格被广泛用于各种任务,从简单的数据录入和分析,到复杂的财务建模和决策。然而,由于“广泛的二维网格、各种布局和多种格式选项”,导致现有的大型语言模型(LLM)很难理解电子表格的内容并对其进行推理。

为此,微软推出了 SpreadsheetLLM,想要“开创一种高效的编码方法,以此释放和优化 LLM 在电子表格上强大的理解和推理能力”。

最初,微软研究团队采用了一种原始的序列化方法,整合了单元格的地址、值以及格式信息。但是这种方法受限于 LLMs 的 token 限制,对大多数应用来说并不实用。为了解决这一难题,微软开发了一种创新的编码框架 SheetCompressor,它能够有效压缩电子表格,使其更加适配 LLM 的处理需求。

(SheetCompressor 框架示意图)

从框架图中可以看出,SheetCompressor 框架由三个核心模块组成:

  • 基于结构锚点的压缩:在整个电子表格中放置“结构锚点”,帮助 LLM 理解数据结构。

  • 反向索引转换:把电子表格转换为更紧凑的格式,并消除冗余数据。

  • 数据格式感知聚合:根据数字格式和数据类型,对相邻单元格进行分组。

微软表示,在电子表格检测任务中,SheetCompressor 大幅提升了处理速度和准确率:相较于原始的序列化方法,在 GPT-4 的上下文学习环境下,性能提升了 25.6%。此外,经过 SheetCompressor 微调的 LLM,即使平均压缩比例高达 25 倍,但 F1 得分(一种衡量二分类模型精确度的指标)仍能达到业界领先的 78.9%,超越同类模型 12.3%。更值得一提的是,在对各种 LLM 进行“全面评估”后,微软发现 SheetCompressor 可将电子表格编码的 token 使用量大幅减少 96%。

不过,微软也承认目前 SpreadsheetLLM 模型仍有一些限制,如无法很好理解复杂或结构化程度较高的数据,以及不能压缩包含自然语言的单元格等

但总体来说,展望未来 SpreadsheetLLM 能让更多用户更容易访问和理解电子表格数据,还能帮助自动化许多与电子表格数据分析相关的繁琐耗时的任务,如数据清理、格式化和汇总。借助 AI 加持下的 SpreadsheetLLM,未来企业有望节省许多时间和资源,让员工专注于需要人类判断力和创造力的高价值活动。

参考链接:

https://arxiv.org/abs/2407.09025?ref=thestack.technology

https://www.thestack.technology/microsoft-llm-spreadsheet-llm/

推荐阅读:

月薪集中在8k-17k、近六成的人一年没跳槽、AI可减少20%-40%工作量,2024中国开发者调查报告来了!

程序员凭一己之力自研浏览器,挑战Chrome:GitHub联合创始人力挺,投百万美元支持!

“一年努力白费,7 万多美元打水漂……这简直是开发地狱!”

炎炎夏日🔥,AI 科技大本营送清凉福利!

扫码回复“抽奖”即有机会获得时尚 T 恤、精选图书和大会精品 PPT 等好礼~

相关推荐

  • 下半年,必须要干点大项目了
  • 绕晕了!9.11 大还是 9.9 大,难倒一批 AI 大模型?
  • 大模型集体失智!9.11比9.9大?全员翻车!
  • 曾年入140亿的巨头,要破产了
  • 30B!每秒100tokens!这是AMD对AI PC的“幻想时间”
  • Reddit传疯的Claude 3.5 Artifacts 的核心系统提示词!Code效果猛增
  • 编程算法:信息学奥赛 CSP-J/S 2024 报名通知
  • 首个专为半导体行业设计的开源大模型 SemiKong 问世
  • 改善 Kubernetes 日志以增强可观测性
  • Construct 公司从 0 到 1 基于 Kitex+Istio 的微服务系统建设
  • 是时候重塑金融机构的思想结构与资产结构了
  • 入局大模型!值得开发者好好看一看的 AI 入门法!(内附教程)| 极客时间
  • 刚刚!苹果发布新款iPhone重大更新预览版,果粉测试方法来了
  • 无须英伟达,AMD本地可跑CUDA?惊现极客团队开发三方编程工具包,网友群议指责AMD无作为:已经晚了,CUDA已经是事实标准了
  • 神经网络架构「殊途同归」?ICML 2024论文:模型不同,但学习内容相同
  • VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格
  • Claude 3.5核心编码prompt揭秘,全网码农沸腾!四步调教法,最新V2版放出
  • 一枚「弃子」打破80年黎曼猜想纪录!菲尔兹奖得主MIT大拿联手,陶哲轩转赞
  • 提升准确率召回率的创新风控策略与算法
  • 图技术在金融反欺诈中的应用