近日,阿里巴巴Qwen團隊宣布Qwen3全系模型完成蘋果MLX框架的官方適配,涵蓋從0.6B(6億參數)到235B(2350億參數)的8個尺寸,并支持4bit、6bit、8bit、BF16四種量化精度,總計32個版本模型。
蘋果MLX框架自2023年12月推出后,主要適配歐美模型(如Llama)。盡管蘋果在2024年2月已確認與阿里合作開發中國版Apple Intelligence,但2025年WWDC大會仍未公布具體進展。
蘋果自研的MLX框架是為Apple Silicon芯片(M1/M2/M3系列)深度優化的開源機器學習工具,而Qwen3作為阿里巴巴通義實驗室的最新成果,憑借其混合架構(MoE)、多語言支持和高效推理能力,成為首個全面適配MLX的國產大模型。
此次官宣,Qwen3將成為蘋果面向中國市場首個全面落地的中文大模型。
官方適配的戰略意義
4 月 28 日,在 Qwen3 發布前夕,蘋果 MLX Community 成員就在 X 上率先宣布完成了 Qwen3 的適配。 Huggingface 平臺上,在所有 MLX 模型中,排名前五有兩個都是 Qwen3 模型,這一數據充分彰顯了 Qwen3 模型在蘋果開發者群體中的受歡迎程度和廣泛應用。
社區適配更多的是基于技術愛好者們的熱情,是一種自發的 “粉絲行為”。而此次發布者變成了 Qwen 官方團隊,給出了一個明確的信號:Qwen 團隊將為這一技術路線提供持續、穩定、可靠的官方支持。
阿里通義千問開源負責人林俊旸在X上回應,“這是一個小更新,但由于模型太多,我們甚至需要用 Mac Studio 進行測試,所以花了不少時間。希望這些更新對 MLX 用戶有所幫助!”
Qwen3 與蘋果 MLX 框架的碰撞
MLX 是蘋果專為 Apple Silicon 芯片設計的高效機器學習框架,提供了類 PyTorch 的 API,這對于熟悉 PyTorch 的開發者而言,降低了學習和使用成本,快速上手進行相關開發工作。同時,它兼容 Numpy 語法,Numpy 在數據處理和科學計算領域應用極為廣泛。MLX 還支持 C++/Swift 擴展,這使得開發者可以根據具體需求,靈活地對框架進行定制和拓展。
利用統一內存架構是 MLX 的一大亮點。在這種架構下,數據在 CPU/GPU 間能夠實現共享,帶來的直接好處便是降低了功耗,同時顯著提升了處理速度。MLX 具備動態圖構建、多模態支持、端側部署優化等一系列功能。這些功能的協同作用,使得它能夠在 iPhone、iPad、Mac 等各種蘋果設備上高效運行模型,極大地幫助開發者更輕松地進行機器學習模型訓練與部署。
為更好服務開發者,通義團隊推出基于 MLX 框架深度優化的全部 Qwen3 系列模型,每款模型都有 4bit、6bit、8bit 和 BF16 等 4 種不同精度的量化版本,即共有 32 款官方的 Qwen3 MLX 模型一次性全開源。這些豐富的選擇允許用戶根據自身設備的硬件資源情況,精準地選擇合適的模型精度。
目前從 Mac Pro、Mac Studio 到 Mac mini、 MacBook ,再到 iPad 、 iPhone等,都可以部署 Qwen3。
下載地址:
Huggingface:https://huggingface.co/collections/Qwen/qwen3-67dd247413f0e2e4f653967f
ModelScope: https://modelscope.cn/collections/Qwen3-9743180bdc6b48
對于開發者而言,這種細致的劃分具有極大的實用價值。例如,低量化(如 4bit)非常適合內存有限的設備,像 iPhone,在這類設備上運行低量化模型可以在有限的硬件條件下實現輕量級 AI 助手功能,滿足用戶日常一些簡單的 AI 需求;而高精度(如 BF16)則適合需要更高推理質量的場景,比如在配備 M2/M3 Ultra 芯片的 Mac Studio 上進行復雜 AI 內容創作時,高精度模型能夠提供更優質、更準確的推理結果,助力創作者實現更出色的作品。
在激烈的 AI 競爭環境下,蘋果在 AI 領域的發展進程備受關注。Qwen3這種 “量體裁衣” 式的優化,本質上是阿里與蘋果硬件的一次深度且積極的協同。
Qwen3的MLX適配,直接解決了蘋果在中國市場的本地化需求。通過開源策略,阿里巴巴吸引開發者共建生態,為國行版Apple Intelligence的推出奠定基礎。
對阿里巴巴而言,Qwen3成為首個適配蘋果生態的國產大模型,打破此前華為、小米等廠商在安卓陣營的主導地位。通過MLX框架,Qwen3可無縫集成到蘋果開發者工具鏈中,覆蓋全球數億蘋果用戶。而且蘋果生態的高付費用戶群體,為Qwen3的商業化(如API調用、定制服務)提供廣闊市場。
目前,全球大模型市場呈現“中美雙雄”格局,美國市場以谷歌Gemini、微軟Phi-3、Meta Llama 3為代表,主打云端大模型與企業級服務;中國陣營以通義千問、文心一言、百川智能為代表,聚焦端側部署與場景化落地。
Qwen3登陸MLX不僅是技術優化,更是阿里向蘋果生態注入的“中國解決方案”。