微软野心再现:对Excel和谷歌Sheet下手了!
编辑 | 星璇
微软团队在办公领域有着很强的“AI霸者”的野心。
近日,微软最新公布的
研究论文
,正在计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型--SpreadsheetLLM。
研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。
而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。
论文摘要部分,SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合。
SpreadsheetLLM 大大提高了电子表格表检测任务的性能,在 GPT4 的情境学习设置中,比普通方法高出 25.6%;使用词元(token)的成本降低了 96%,并能提供更好的处理结果。
论文指出,这种电子表格LLM框架,显著提高了LLM解释和利用电子表格的方式。但还有很多改进的空间,比如这种方法没有利用电子表格格式的细节,如背景颜色和边框,因为它们需要太多的标记(这些元素通常包含有价值的上下文和视觉线索,可以进一步深化模型对电子表格数据的理解和处理)。
此外,虽然SheetCompressor有效地聚合了数据区域,但它目前没有对包含自然语言的单元格采用复杂的基于语义的压缩方法。例如,将“中国”、“美国”和“法国”等术语归入“国家”等统一标签下,不仅可以提高压缩比,还可以加深LLM对数据的语义理解。探索这些先进的语义压缩技术将是我们持续努力增强SpreadsheetLLM功能的一个关键重点。
目前还没有关于微软计划何时或是否向公众提供 SpreadsheetLLM 的消息。
参考链接:
https://arxiv.org/html/2407.09025v1
——好文推荐——
GPT-4o们其实都是眼盲!OpenAI奥特曼自曝自家模型:推理比人弱。研究证明:多模态能力还差得远,杨立昆上大分
无须英伟达,AMD本地可跑CUDA?惊现极客团队开发三方编程工具包,网友群议指责AMD无作为:已经晚了,CUDA已经是事实标准了
相关推荐
百度内容生态视频AIGC新探索
神速!枪击特朗普刺客手机已被破解!一文讲解FBI破解手机有多难:曾找苹果CEO库克建后门惹怒被拒,FBI:花百万美元我们自己搞!
【云原生|K8S系列】K8s新手必看,不可不知的K8s技能,Service发现全解析!
首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!
Prompt工程师要下岗了!北大发布Prompt自动增强系统PAS,超越SOTA
AI+教育!前OpenAI联创Andrej Karpathy官宣创业!创办第一所AI原生学校
无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
早半年发arXiv,却被质疑抄袭:活在微软AutoGen阴影里的CAMEL
AKOOL助力戛纳广告大奖,发布革命性实时数字人平台
程序员都干过哪些很刺激的事情?
React 渲染流程可视化,有大佬实现了!
KG与大模型之三问三答及Agent遇见RAG:PersonalRAG及长文本压缩新策略CompAct
今天,我38岁了!
利用 RFM 和 CLTV 进行客户价值分析
你见过最烂的代码长什么样子?挺好,防止忘记密码,大隐隐于市
人类警惕!AI是个大骗子!
从校招新星到前端技术专家的成长之路
第一批使用多模态的程序员,已经碾压同事了!