从2022.11.30 OpenAI发布ChatGPT 3.0后,大模型呈现大爆炸式发展,AI的重要性一下子大提升,经历了拉资源、AI创业公司、大厂提升到战略高度、百模大战、大规模推理应用。而这一切都离不开数据,训练数据成为模型效果的核心要素之一。在AICon(全球人工智能开发与应用大会)也经常会有大模型数据相关专题技术分享。阿里巴巴国际数字商业集团(Alibaba International Digital Commerce,简称AIDC),是一家跨境电子商务集团,主要业务在跨境电子商务上,旗下业务包含AliExpress、Lazada、阿里巴巴国际站ICBU、Trendyol、Daraz、Miravia等。在这样的全球电商业务背景下,我们需要解决的是多语言场景下的内容本地化、全球用户服务、全球市场营销等全球业务问题。在这样的业务背景和大模型技术背景下,AIDC研发了多语言大模型,以提升效率和解决业务发展中遇到的问题。大语言模型其中一个典型的业务场景是翻译,翻译作为NLP的一个细分子领域,在近年来一直以NMT技术为主,基于大模型的翻译蕴藏着巨大的机会目前业界翻译技术的水平在各个语系下表现如下图,从图可以清晰看到Google Translate表现强劲,其核心技术就是NMT,GPT-4在一些语系上表现优秀,但是在很多语系上表现仍然有不小的差距。阿里国际多语言翻译大模型就是在这样的技术背景和业务背景下开始的。