小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?


MiMo 這名字好可愛

除了 ChatGPT、DeepSeek,現在又有一款新模型問世!小米集團今日(30日)宣布第一個專為推理而生的大模型「Xiaomi MiMo」,為百家爭鳴的 AI 競爭投下一個震撼彈

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

Xiaomi MiMo 厲害在哪?小米集團聲稱此模型只憑藉 7 B 的參數規模,就超越 OpenAI 的閉源推理模型 o1mini 以及阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview,其強大的推理能力,是由於預訓練和後訓練階段的多層面創新驅動

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在預訓練過程中,模型已見過許多推理模式,又分為數據和訓練。在數據方面,模型藉由挖掘大量的推理語料,合成出約 200 Btokens 的推理數據,更進行三階段訓練,逐步增加訓練難度,總訓練已達 25T 的 tokens

至於後訓練方面,重點是讓強化學習(RL)的表現更穩定、更有效率,又分成兩部分:演算法和系統架構

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

在演算法方面,小米設計出新方法「Test Difficulty Driven Reward」,專門解決在比較困難的情況下,強化學習容易遇到獎勵太少、學不起來的問題;另外也加入「Easy Data Re-Sampling」策略,讓訓練過程更平穩

至於系統架構,小米打造一套訓練流程「Seamless Rollout」,提升整體 RL 訓練速度到 2.29 倍,驗證速度也快了 1.96 倍,大幅提升效率

(圖片來源:科技網)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

相信大家一定很疑惑,跟備受大眾喜愛的 ChatGPT 相比,有什麼不同呢?ChatGPT 由 OpenAI 開發,屬於大型通用語言模型,具備突出的語言理解與生成能力,而 Xiaomi MiMo 由小米集團自己研發,可預測的是,其將會成為專門替小米生態系統優化的 AI 助手,功能設計更偏重生活實用與裝置控制

(圖片來源:Shutterstock)

小米開發新推理模型 MiMo !比 OpenAI、阿里 Qwen 強?

值得注意的是,MiMo-7B 全系列模型均已開源,推出日期甚至在阿里巴巴發佈新一代通義千問模型 Qwen3 的隔日,AI 競爭火藥味真的是隔著屏幕也聞的到。接下來就期待各家模型的實測比較了!

電獺少女 Instagram 精選每日科技新聞和促咪事件,還有各類 App 的密技心得,就差你沒追蹤!  

嘻嘻

嘻嘻