LLM构建AI应用 —— 工程师如何使用黑盒工具
Source :
mp.weixin.qq.com
Author :
武俍俍
从2022年12月以来,chatGPT 的横空出世掀起了新一波的 AI 浪潮,热度一直居高不下直到现在。半年时间里,从底层模型 API 到上层应用的生态逐渐建立,经过一轮轮迭代不断完善创新。本文将结合开源框架和应用程序,从工程师的角度,与大家讨论如何对大语言模型进行封装和应用,并从工程层面解决现有问题,搭建完整可商用的 AI 应用程序。 LLM,Large Language Model,即大语言模型。这个“大”是说参数量大(通常数十亿个权重或更多),是一种语言模型的概念。为了更深入理解,我们选用OpenAI 公司的 GPT 模型进行讨论。本文实验都在 GPT3.5 的模型上进行(GPT4 太贵了)。