記者從度小滿(mǎn)獲悉,近日,度小滿(mǎn)正式開(kāi)源國內首個(gè)千億級中文金融大模型——“軒轅”。
據介紹,軒轅大模型是在1760億參數的Bloom大模型基礎上訓練而來(lái),在金融名詞理解、金融市場(chǎng)評論、金融數據分析和金融新聞理解等任務(wù)上,效果相較于通用大模型大幅提升,表現出明顯的金融領(lǐng)域優(yōu)勢。在金融場(chǎng)景中的任務(wù)評測中,軒轅全面超越了市場(chǎng)上的主流開(kāi)源大模型,贏(yíng)得了150次回答中63.33%的勝率,充分凸顯了其在金融領(lǐng)域的顯著(zhù)優(yōu)勢。在通用能力評測中,軒轅有10.2%的任務(wù)表現超越ChatGPT 3.5,61.22%的任務(wù)表現與之持平,涉及數學(xué)計算、場(chǎng)景寫(xiě)作、邏輯推理、文本摘要等13個(gè)主要維度。
為了提升軒轅大模型對金融領(lǐng)域問(wèn)題的理解能力,度小滿(mǎn)將自身業(yè)務(wù)中積累的金融領(lǐng)域的千億tokens的中文預訓練數據集用來(lái)訓練模型。該數據集涵蓋了金融研報、股票、基金、銀行、保險等各個(gè)方向的專(zhuān)業(yè)知識。經(jīng)過(guò)清洗和標注的高質(zhì)量數據集,不僅在通用性方面與ChatGPT達到持平成為可能,且顯著(zhù)提升了模型在金融垂直領(lǐng)域的性能。
目前,千億級的軒轅模型已可以在Huggingface中申請下載,面向所有金融機構開(kāi)放。
“軒轅大模型是經(jīng)度小滿(mǎn)業(yè)務(wù)場(chǎng)景中積累的金融數據訓練而來(lái)的,對金融相關(guān)問(wèn)題的理解比通用大模型更有優(yōu)勢?!倍刃M(mǎn)CTO許冬亮說(shuō),我們把大模型能力開(kāi)放給金融機構,有利于推動(dòng)大模型在金融行業(yè)的應用,降低大模型的應用門(mén)檻,提升金融行業(yè)智能化水平。
對于軒轅大模型開(kāi)源后,對金融機構的意義。許冬亮認為,生成式大模型在內容生成與創(chuàng )作、信息摘要與總結、知識理解與問(wèn)答、自然交互與對話(huà)等方面具備非常出色的能力,在金融場(chǎng)景中會(huì )有廣泛的應用。
?
混亂的購票秩序、遠高定價(jià)的“黃牛票”,嚴重困擾觀(guān)眾體驗,擾亂市場(chǎng)秩序。
經(jīng)濟參考報社版權所有 本站所有新聞內容未經(jīng)經(jīng)濟參考報協(xié)議授權,禁止轉載使用
新聞線(xiàn)索提供熱線(xiàn):010-63074375 63072334 報社地址:北京市宣武門(mén)西大街57號
JJCKB.CN 京ICP備18039543號