每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

運營商大模型來了:電信開源12B星辰大模型 移動客服大模型可正式對外提供相關服務

每日經濟新聞 2024-04-16 23:30:56

每經記者 楊卉    每經編輯 梁梟    

來自運營商的大模型正在加速進入市場。4月16日,《每日經濟新聞》記者從中國電信處獲悉,近日中國電信開源了12B參數規(guī)模星辰語義大模型TeleChat-12B。相較于1月開源的7B版本,內容、性能和應用等方面整體效果提升了30%。其中,多輪推理、安全問題等領域提升超40%。另外,據了解,中國電信將于年內開源千億級參數大模型。

根據中國電信提供的信息,TeleChat-12B將7B版本1.5T訓練數據提升至3T,此次開源提供基礎模型以及基于相應版本的對話模型,支持傳統(tǒng)的全量參數更新及LoRA等只更新部分參數的高效微調方法;支持Deepspeed微調、支持int8、int4量化和國產芯片訓練推理。中國電信方面表示,星辰語義大模型已應用于行文寫作、代碼編程、網絡故障分析以及經營分析等場景。行文寫作方面,平均生成字數超過1500字,有效采納率為85.7%。

同日,記者還從中國移動處獲悉,近日,國家互聯網信息辦公室發(fā)布第五批境內深度合成服務算法備案信息公告,中國移動客服大模型算法通過服務提供者備案,標志著可正式對外提供生成式人工智能服務,成為央企首個全自研、全備案的行業(yè)大模型。

據中國移動方面介紹,中國移動客服大模型主要應用于面向客戶的意圖識別與多輪應答,是以“中國移動九天通用大模型”為底座,應用客服領域專業(yè)數據訓練的客服行業(yè)專業(yè)大模型,具備百億參數大模型的通用交互能力和覆蓋中國移動全業(yè)務的專業(yè)客服能力。

去年以來,運營商切入大模型的意愿已經十分明顯。中國電信就在2023年年報中表示,2024年公司將把握以人工智能為代表的新一輪科技革命和產業(yè)變革趨勢;另據東湖國家自主創(chuàng)新示范區(qū)官方微信公眾號消息,中國移動九天人工智能團隊將于2024年底對標GPT-4完成多模態(tài)大模型訓練,含8款子平臺、287項核心算法能力、37項規(guī)?;瘧茫峁闹撬慊A設施、核心算法能力到智能化應用的全棧人工智能服務,可服務政務、工業(yè)、教育、醫(yī)療等多個領域。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

大模型

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费va国产高清不卡大片,笑看风云电视剧,亚洲黄色性爱在线观看,成人 在线 免费