華爾街見聞 2024-07-16 11:41:51
12日,Microsoft發(fā)布了一個新的大型語言模型,計劃為Excel、谷歌Sheets等電子表格應(yīng)用程序開發(fā)全新的AI大語言模型--SpreadsheetLLM。
Microsoft在論文指出,SpreadsheetLLM作為一款全新的AI模型,將廣泛使用于理解并處理復(fù)雜的電子表格數(shù)據(jù)。
SpreadsheetLLM具有改變電子表格數(shù)據(jù)管理和分析的潛力,為更智能和高效的用戶交互鋪平了道路。
這或許會讓會計師和數(shù)據(jù)分析師們對他們的未來工作前景感到擔(dān)憂。網(wǎng)友們在社交平臺X上調(diào)侃,認(rèn)為“凱倫的工作很快就會被人工智能取代”。
“凱倫可能很快就會失業(yè)”
研究人員指出,當(dāng)前的電子表格應(yīng)用程序功能豐富,在布局和格式方面為用戶提供了大量選擇,這使得傳統(tǒng)的AI大語言模型難以在電子表格處理方面發(fā)揮作用。而SpreadsheetLLM就是專門為電子表格應(yīng)用而設(shè)計的AI模型。
微軟還開發(fā)了SheetCompressor(壓縮電子表格)工具,以幫助SpreadsheetLLM更好地理解和處理電子表格數(shù)據(jù)。
研究人員稱,SpreadsheetLLM的潛在應(yīng)用非常廣泛,從自動執(zhí)行日常數(shù)據(jù)分析任務(wù),到提供基于電子表格數(shù)據(jù)的智能見解和建議。例如,SpreadsheetLLM可用于自動生成財務(wù)報告、識別數(shù)據(jù)中的異?;蜈厔?、為客戶提供個性化的產(chǎn)品或服務(wù)推薦等。
因此,SpreadsheetLLM有可能徹底改變企業(yè)處理數(shù)據(jù)的方式。
一位用戶聲稱:“正如我們所知,能夠編寫SQL的LLM將扼殺整個數(shù)據(jù)工程行業(yè)。”
另一位寫道,“SaaS陷入了深深的麻煩。”
“這對金融界來說將產(chǎn)生巨大影響”
賓夕法尼亞大學(xué)沃頓商學(xué)院副教授伊桑·莫利克(Ethan Mollick)在推特上寫道:“這再次表明LLM很快就能處理結(jié)構(gòu)化和非結(jié)構(gòu)化電子表格數(shù)據(jù)。這將解鎖許多用例(預(yù)測、財務(wù)、估值等),并且擁有電子表格真實(shí)來源往往會減少幻覺。”
SpreadsheetLLM如何工作?
SpreadsheetLLM通過將電子表格數(shù)據(jù)編碼為大型語言模型(LLM)可以理解的格式,從而使LLM能夠?qū)﹄娮颖砀駭?shù)據(jù)進(jìn)行推理、回答有關(guān)數(shù)據(jù)的問題,甚至根據(jù)自然語言提示生成新的電子表格。
SpreadsheetLLM的核心是“SheetCompressor”框架,該框架可以有效地壓縮和編碼電子表格數(shù)據(jù),使其更易于LLM處理。SheetCompressor由三個模塊組成:
▲基于結(jié)構(gòu)錨點(diǎn)的壓縮:在整個電子表格中放置“結(jié)構(gòu)錨點(diǎn)”,以幫助LLM理解數(shù)據(jù)結(jié)構(gòu)。
▲逆索引翻譯:將電子表格轉(zhuǎn)換為更緊湊的格式,并消除冗余數(shù)據(jù)。
▲數(shù)據(jù)格式感知聚合:根據(jù)數(shù)字格式和數(shù)據(jù)類型對相鄰單元格進(jìn)行分組。
SHEETCOMPRESSOR框架的插圖(圖片:Microsoft)
Microsoft稱,SpreadsheetLLM顯著提高了電子表格檢測任務(wù)的性能,在GPT4的上下文學(xué)習(xí)設(shè)置中比普通方法高出25.6%,使用詞元(token)的成本降低了96%,并能提供更好的處理結(jié)果。
目前,Microsoft還沒有公布何時向公眾發(fā)布SpreadsheetLLM的消息。該論文指出,該模型仍有一些限制,如對于復(fù)雜或結(jié)構(gòu)化程度高的數(shù)據(jù),其理解能力仍然有限;SheetCompressor目前還不能壓縮包含自然語言的單元格等等。
(作者 張雅琦)
封面圖片來源:視覺中國-VCG41N1472123004
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP