2023-07-13 14:12:30
當(dāng)?shù)貢r間7月12日,Google和DeepMind的科研人員在《自然》雜志上發(fā)表一項研究,提出了MultiMed QA評估基準(zhǔn),用于評測大語言模型在臨床知識方面的表現(xiàn)。結(jié)果研究人員發(fā)現(xiàn),大語言模型構(gòu)建的AI醫(yī)生在很多方面與人類醫(yī)生相當(dāng)。
谷歌的研究人員表示,這項技術(shù)不會威脅到全科醫(yī)生的工作,但未來可能可以用于醫(yī)療求助熱線。
研究人員提出一個評估基準(zhǔn)來評測大語言模型在臨床知識方面的表現(xiàn),在引入指令提示調(diào)整后,由此產(chǎn)生的模型Med-PaLM表現(xiàn)令人鼓舞:92.6%的長篇答案符合科學(xué)共識,與臨床醫(yī)生生成的答案(92.9%)相當(dāng);5.9%的答案被評為可能導(dǎo)致有害結(jié)果,與臨床醫(yī)生生成的答案(5.7%)的結(jié)果相似。(澎湃新聞)
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP