Posted in

微软野心再现:对 Excel 和谷歌 Sheet 下手了!_AI阅读总结 — 包阅AI

包阅导读总结

1. 微软、Excel、谷歌 Sheet、SpreadsheetLLM、电子表格

2. 微软计划为 Excel 和谷歌 Sheets 开发 AI 大语言模型 SpreadsheetLLM,该模型由 3 个模块组成,大幅提高电子表格检测任务性能,降低成本,但仍有改进空间,目前微软未透露其向公众提供的时间。

3.

– 微软团队在办公领域有很强的“AI 霸者”野心。

– 最新公布研究论文,计划为 Excel、谷歌 Sheets 等开发 AI 大语言模型 SpreadsheetLLM。

– 现有电子表格应用程序功能丰富,传统 AI 大语言模型难以胜任处理场景。

– SpreadsheetLLM 专为电子表格应用设计,还研发了 SheetCompressor 辅助理解处理数据。

– 论文摘要:SpreadsheetLLM 由 3 个模块组成,性能提高,成本降低。

– 存在改进空间:未利用格式细节,未对自然语言单元格采用复杂压缩方法。

– 目前微软未透露是否及何时向公众提供 SpreadsheetLLM。

思维导图:

文章地址:https://mp.weixin.qq.com/s/8G5h9umgcEd2Rq2cBIKkjw

文章来源:mp.weixin.qq.com

作者:51CTO技术栈

发布时间:2024/7/17 4:24

语言:中文

总字数:867字

预计阅读时间:4分钟

评分:88分

标签:AI大模型,电子表格处理,微软,人工智能应用,数据处理


以下为原文内容

本内容来源于用户推荐转载,旨在分享知识与观点,如有侵权请联系删除 联系邮箱 media@ilingban.com

cover_image

微软野心再现:对Excel和谷歌Sheet下手了!

51CTO技术栈

编辑|星璇

微软团队在办公领域有着很强的“AI霸者”的野心。

近日,微软最新公布的研究论文,正在计划为 Excel、谷歌 Sheets 等电子表格应用程序,开发全新的 AI 大语言模型–SpreadsheetLLM。


研究人员表示现有电子表格应用程序具备丰富的功能,在布局和格式方面为用户提供大量的选项,因此传统 AI 大语言模型很难胜任电子表格处理场景。


而 SpreadsheetLLM 就是专门为电子表格应用而设计的 AI 模型,微软还研发了 SheetCompressor(压缩电子表格),让 SpreadsheetLLM 能够更好地理解、处理电子表格数据。

论文摘要部分,SpreadsheetLLM 模型主要由 3 个模块组成:基于结构锚的压缩、反向索引转换和数据格式感知聚合。


SpreadsheetLLM 大大提高了电子表格表检测任务的性能,在 GPT4 的情境学习设置中,比普通方法高出 25.6%;使用词元(token)的成本降低了 96%,并能提供更好的处理结果。

论文指出,这种电子表格LLM框架,显著提高了LLM解释和利用电子表格的方式。但还有很多改进的空间,比如这种方法没有利用电子表格格式的细节,如背景颜色和边框,因为它们需要太多的标记(这些元素通常包含有价值的上下文和视觉线索,可以进一步深化模型对电子表格数据的理解和处理)。

此外,虽然SheetCompressor有效地聚合了数据区域,但它目前没有对包含自然语言的单元格采用复杂的基于语义的压缩方法。例如,将“中国”、“美国”和“法国”等术语归入“国家”等统一标签下,不仅可以提高压缩比,还可以加深LLM对数据的语义理解。探索这些先进的语义压缩技术将是我们持续努力增强SpreadsheetLLM功能的一个关键重点。

目前还没有关于微软计划何时或是否向公众提供 SpreadsheetLLM 的消息。
参考链接:https://arxiv.org/html/2407.09025v1
——好文推荐——

GPT-4o们其实都是眼盲!OpenAI奥特曼自曝自家模型:推理比人弱。研究证明:多模态能力还差得远,杨立昆上大分
无须英伟达,AMD本地可跑CUDA?惊现极客团队开发三方编程工具包,网友群议指责AMD无作为:已经晚了,CUDA已经是事实标准了

预览时标签不可点

微信扫一扫
关注该公众号

继续滑动看下一个
51CTO技术栈
向上滑动看下一个
    知道了
    微信扫一扫
    使用小程序
    取消允许

    视频小程序,轻点两下取消赞在看,轻点两下取消在看分享留言收藏