商量SenseChat 2.0發(fā)布:語言大模型研究取得重要突破


【資料圖】

近日,商湯科技發(fā)布了自研中文語言大模型“商量SenseChat 2.0”的測試成績,數(shù)據(jù)顯示在MMLU、AGIEval、C-Eval三個權(quán)威大語言模型評測基準中均超越了OpenAI的ChatGPT。在某些方面,商量SenseChat 2.0的表現(xiàn)已接近GPT4的水平,意味著我國語言大模型研究取得了重要突破。 這三個測試分別為:MMLU是美國加州大學(xué)伯克利分校等高校構(gòu)建的多任務(wù)考試評測集;AGIEval是微軟研究院推出的學(xué)科考試評測集,包括中國高考、司法考試及美國SAT、LSAT、GRE和GMAT等;C-Eval是由上海交通大學(xué)、清華大學(xué)和愛丁堡大學(xué)合作構(gòu)建的面向中文語言模型的綜合性考試評測集。在這三個測試中,商量SenseChat 2.0的表現(xiàn)均超越了ChatGPT以及國內(nèi)外多款大模型,僅次于GPT-4。 在MMLU測試中,商量SenseChat 2.0的綜合得分為68.6,位居第二,僅次于GPT-4(86.4分);在AGIEval測試中,商量SenseChat 2.0以49.91分緊追GPT-4(56.4分);在C-Eval測試中,商量SenseChat 2.0獲得66.1分,僅次于GPT-4(68.7分)。 目前,已有近千家企業(yè)客戶通過申請使用商量SenseChat 2.0,體驗其長文本理解、邏輯推理、多輪對話、情感分析、內(nèi)容創(chuàng)作、代碼生成等綜合能力。商湯科技表示,將持續(xù)對“商量SenseChat 2.0”進行快速迭代和提升,實現(xiàn)知識的實時更新。

推薦DIY文章
今日熱議:從你的全世界路過熱拍 該影視作品根據(jù)張嘉佳同名小說改編
焦點關(guān)注:15個最好用的網(wǎng)站推薦 今日熱榜是一個實用的熱榜合集網(wǎng)站
當前熱文:坐觀光巴士游上海 這是對當?shù)仫L景全貌了解的快捷方式
流傳百年的神秘海怪傳說 為什么這些傳說是真是假無人能辨
樊梨花簡介:她是一個敢愛敢恨、胸懷寬廣的大唐奇女
研發(fā)科比4代球鞋的背景 MVP白金、MVP黑金的銷量如何 觀焦點
精彩新聞

超前放送