在线工具大全

中选ICML Oral！豆包大模型团队实习生提出 IR-QLoRA，将信息论引入LLM

出处： mp.weixin.qq.com 作者：豆包大模型团队

本文提出一种新颖的 IR-QLoRA 方法，通过信息保留，推动 LoRA 微调量化下大语言模型保持高度准确性。该成果第一次明确引入信息论视角，透过信息熵相关理论，对大模型量化进行审视与衡量，目前已中选 ICML 2024 Oral 。

查看原文

54 技术 lddgo 分享于 2024-07-22