海角社区国产精品伦子伦免费,日韩在线观看一区二,日本中文字幕有码,青青热九免费精品视频在线

        • <acronym id="lefsy"></acronym>

          <sup id="lefsy"><thead id="lefsy"><pre id="lefsy"></pre></thead></sup>
          每日經(jīng)濟(jì)新聞
          要聞

          每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

          阿里千問(wèn)3登頂全球最強(qiáng)開(kāi)源模型,成本僅需DeepSeek-R1三分之一

          每日經(jīng)濟(jì)新聞 2025-04-29 09:43:48

          每經(jīng)記者|葉曉丹    每經(jīng)編輯|陳俊杰    

          每經(jīng)杭州4月29日電(記者葉曉丹)記者從阿里云獲悉,4月29日凌晨,阿里巴巴開(kāi)源新一代通義千問(wèn)模型Qwen3(簡(jiǎn)稱(chēng)千問(wèn)3),參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強(qiáng)開(kāi)源模型。千問(wèn)3是國(guó)內(nèi)首個(gè)“混合推理模型”,“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡(jiǎn)單需求可低算力“秒回”答案,對(duì)復(fù)雜問(wèn)題可多步驟“深度思考”,大大節(jié)省算力消耗。

          千問(wèn)3采用混合專(zhuān)家(MoE)架構(gòu),總參數(shù)量235B,激活僅需22B。千問(wèn)3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T ,并在后訓(xùn)練階段多輪強(qiáng)化學(xué)習(xí),將非思考模式無(wú)縫整合到思考模型中。千問(wèn)3在推理、指令遵循、工具調(diào)用、多語(yǔ)言能力等方面均大幅增強(qiáng),即創(chuàng)下所有國(guó)產(chǎn)模型及全球開(kāi)源模型的性能新高:在奧數(shù)水平的AIME25測(cè)評(píng)中,千問(wèn)3斬獲81.5分,刷新開(kāi)源紀(jì)錄;在考察代碼能力的LiveCodeBench評(píng)測(cè)中,千問(wèn)3突破70分大關(guān),表現(xiàn)甚至超過(guò)Grok3;在評(píng)估模型人類(lèi)偏好對(duì)齊的ArenaHard測(cè)評(píng)中,千問(wèn)3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同時(shí),千問(wèn)3的部署成本還大幅下降,僅需4張H20即可部署千問(wèn)3滿血版,顯存占用僅為性能相近模型的三分之一。

          如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
          未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

          讀者熱線:4008890008

          特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

          歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

          每經(jīng)經(jīng)濟(jì)新聞官方APP

          2

          0