一聚教程网:一个值得你收藏的教程网站

热门教程

Ollama v0.30.0 改用 llama.cpp 架构原生支持 GGUF 并引入 MLX 加速

时间:2026-05-30 08:18:01 编辑:袖梨 来源:一聚教程网

Ollama v0.30.0 版本正式发布,这次更新直接改变了底层架构。新版本不再基于 GGML 构建,而是改用 llama.cpp 架构,实现了对 GGUF 文件格式的原生支持。同时,Ollama 还引入了 MLX 加速,专门用于提升 Apple Silicon 芯片上的模型推理性能。

技术底层彻底变更,社区反馈是关键

这次架构调整其实挺大的。从 GGML 迁移到 llama.cpp,意味着整个推理引擎的底层逻辑都变了。GGUF 作为新一代模型存储格式,兼容性和加载效率都比老格式强不少。Ollama 团队在预发布阶段已经开放了反馈通道,重点收集性能的提升或下降情况,以及可能出现的错误。毕竟改了底层架构,谁也不敢保证不出点小毛病,对吧?

MLX 加速让 Apple Silicon 用户受益

对于 Mac 用户来说,MLX 加速的加入确实是个好消息。MLX 是苹果自家的机器学习框架,专门针对 M 系列芯片优化。Ollama 在 v0.30.0 中引入 MLX 加速,目的就是让模型在 Apple Silicon 上跑得更快。那这算不算承认了此前 GGML 在 Mac 上的优化不够?反正现在有了更专业的工具,实测数据才能说明问题。

性能测试才是检验标准

用户最关心的还是实际体验。Ollama 团队明确希望社区提供反馈,尤其是性能改善或降级方面的信息。如果你已经在用测试版,不妨试试跑几个模型对比一下。凭什么说新架构就一定快?这得靠实际数据说话。MLX 加速能不能让大模型在 MacBook 上流畅运行,这才是咱们要验证的。

行业影响:本地大模型生态朝着更标准的方向走

llama.cpp 本身就是开源社区里最活跃的推理框架之一,Ollama 直接选择它作为底层,这算是对 GGUF 格式的一种背书。以后开发者打包模型,肯定更倾向于用 GGUF 了。至于 MLX 加速,倒是给所有 Apple Silicon 用户画了个饼——跑本地大模型,真的能比 Windows 平台更顺手吗?这就要看后续的优化力度了。

总结:v0.30.0 是一次值得关注的架构升级

整体来看,这次更新不是小打小闹的修修补补,而是把地基给换了。GGUF 原生支持和 MLX 加速都是实打实的改进,但稳定性还需要社区一起去测试。如果不出大问题,Ollama 之后的版本应该会彻底拥抱 llama.cpp 生态。

热门栏目