2023-07-13 14:12:30
當?shù)貢r間7月12日,Google和DeepMind的科研人員在《自然》雜志上發(fā)表一項研究,提出了MultiMed QA評估基準,用于評測大語言模型在臨床知識方面的表現(xiàn)。結(jié)果研究人員發(fā)現(xiàn),大語言模型構(gòu)建的AI醫(yī)生在很多方面與人類醫(yī)生相當。
谷歌的研究人員表示,這項技術(shù)不會威脅到全科醫(yī)生的工作,但未來可能可以用于醫(yī)療求助熱線。
研究人員提出一個評估基準來評測大語言模型在臨床知識方面的表現(xiàn),在引入指令提示調(diào)整后,由此產(chǎn)生的模型Med-PaLM表現(xiàn)令人鼓舞:92.6%的長篇答案符合科學(xué)共識,與臨床醫(yī)生生成的答案(92.9%)相當;5.9%的答案被評為可能導(dǎo)致有害結(jié)果,與臨床醫(yī)生生成的答案(5.7%)的結(jié)果相似。(澎湃新聞)
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP