小米開發新推理模型 MiMo ！比 OpenAI、阿里 Qwen 強？

2025/05/02 by 嘻嘻

#ai #mimo #小米

MiMo 這名字好可愛

除了 ChatGPT、DeepSeek，現在又有一款新模型問世！小米集團 30 日宣布第一個專為推理而生的大模型「Xiaomi MiMo」，為百家爭鳴的 AI 競爭投下一個震撼彈

Xiaomi MiMo 厲害在哪？小米集團聲稱此模型只憑藉 7 B 的參數規模，就超越 OpenAI 的閉源推理模型 o1mini 以及阿里 Qwen 更大規模的開源推理模型ＱwQ-32B-Preview，其強大的推理能力，是由於預訓練和後訓練階段的多層面創新驅動

小米開發新推理模型 MiMo ！比 OpenAI、阿里 Qwen 強？

在預訓練過程中，模型已見過許多推理模式，又分為數據和訓練。在數據方面，模型藉由挖掘大量的推理語料，合成出約 200 Ｂtokens 的推理數據，更進行三階段訓練，逐步增加訓練難度，總訓練已達 25T 的 tokens

至於後訓練方面，重點是讓強化學習（RL）的表現更穩定、更有效率，又分成兩部分：演算法和系統架構

小米開發新推理模型 MiMo ！比 OpenAI、阿里 Qwen 強？

在演算法方面，小米設計出新方法「Test Difficulty Driven Reward」，專門解決在比較困難的情況下，強化學習容易遇到獎勵太少、學不起來的問題；另外也加入「Easy Data Re-Sampling」策略，讓訓練過程更平穩

至於系統架構，小米打造一套訓練流程「Seamless Rollout」，提升整體 RL 訓練速度到 2.29 倍，驗證速度也快了 1.96 倍，大幅提升效率

（圖片來源：科技網）

小米開發新推理模型 MiMo ！比 OpenAI、阿里 Qwen 強？

相信大家一定很疑惑，跟備受大眾喜愛的 ChatGPT 相比，有什麼不同呢？ChatGPT 由 OpenAI 開發，屬於大型通用語言模型，具備突出的語言理解與生成能力，而 Xiaomi MiMo 由小米集團自己研發，可預測的是，其將會成為專門替小米生態系統優化的 AI 助手，功能設計更偏重生活實用與裝置控制

（圖片來源：Shutterstock）

小米開發新推理模型 MiMo ！比 OpenAI、阿里 Qwen 強？

值得注意的是，MiMo-7B 全系列模型均已開源，推出日期甚至在阿里巴巴發佈新一代通義千問模型 Qwen3 的隔日，AI 競爭火藥味真的是隔著屏幕也聞的到。接下來就期待各家模型的實測比較了！

電獺少女 Instagram 精選每日科技新聞和促咪事件，還有各類 App 的密技心得，就差你沒追蹤！

#ai #mimo #小米

嘻嘻

喜歡科技，因為我喜新厭舊嘿嘿～