Ollama v0.30.0 改用 llama.cpp 架构原生支持 GGUF 并引入 MLX 加速

时间：2026-05-30 08:18:01 编辑：袖梨来源：一聚教程网

Ollama v0.30.0 版本正式发布，这次更新直接改变了底层架构。新版本不再基于 GGML 构建，而是改用 llama.cpp 架构，实现了对 GGUF 文件格式的原生支持。同时，Ollama 还引入了 MLX 加速，专门用于提升 Apple Silicon 芯片上的模型推理性能。

技术底层彻底变更，社区反馈是关键

这次架构调整其实挺大的。从 GGML 迁移到 llama.cpp，意味着整个推理引擎的底层逻辑都变了。GGUF 作为新一代模型存储格式，兼容性和加载效率都比老格式强不少。Ollama 团队在预发布阶段已经开放了反馈通道，重点收集性能的提升或下降情况，以及可能出现的错误。毕竟改了底层架构，谁也不敢保证不出点小毛病，对吧？

MLX 加速让 Apple Silicon 用户受益

对于 Mac 用户来说，MLX 加速的加入确实是个好消息。MLX 是苹果自家的机器学习框架，专门针对 M 系列芯片优化。Ollama 在 v0.30.0 中引入 MLX 加速，目的就是让模型在 Apple Silicon 上跑得更快。那这算不算承认了此前 GGML 在 Mac 上的优化不够？反正现在有了更专业的工具，实测数据才能说明问题。

性能测试才是检验标准

用户最关心的还是实际体验。Ollama 团队明确希望社区提供反馈，尤其是性能改善或降级方面的信息。如果你已经在用测试版，不妨试试跑几个模型对比一下。凭什么说新架构就一定快？这得靠实际数据说话。MLX 加速能不能让大模型在 MacBook 上流畅运行，这才是咱们要验证的。

行业影响：本地大模型生态朝着更标准的方向走

llama.cpp 本身就是开源社区里最活跃的推理框架之一，Ollama 直接选择它作为底层，这算是对 GGUF 格式的一种背书。以后开发者打包模型，肯定更倾向于用 GGUF 了。至于 MLX 加速，倒是给所有 Apple Silicon 用户画了个饼——跑本地大模型，真的能比 Windows 平台更顺手吗？这就要看后续的优化力度了。

总结：v0.30.0 是一次值得关注的架构升级

整体来看，这次更新不是小打小闹的修修补补，而是把地基给换了。GGUF 原生支持和 MLX 加速都是实打实的改进，但稳定性还需要社区一起去测试。如果不出大问题，Ollama 之后的版本应该会彻底拥抱 llama.cpp 生态。

推荐专题

最新下载

热门教程

Ollama v0.30.0 改用 llama.cpp 架构原生支持 GGUF 并引入 MLX 加速

相关文章

热门栏目

php教程

asp.net教程

手机开发

css教程

网页制作

办公数码

jsp教程