在线工具大全

mnn-llm: 大语言模型端侧CPU推理优化

出处： mp.weixin.qq.com 作者： Meta技术团队

在大语言模型(LLM)端侧部署上，基于 MNN 实现的 mnn-llm 项目已经展现出业界领先的性能，特别是在 ARM 架构的 CPU 上。目前利用 mnn-llm 的推理能力，qwen-1.8b在mnn-llm的驱动下能够在移动端达到端侧实时会话的能力，能够在较低内存（<2G）的情况下，做到快速响应。

阿里巴巴技术

查看原文

194 技术 lddgo 分享于 2024-01-05

简体中文