今年双11,淘天集团算法技术团队(以下简称“淘天算法团队”)重点部署了大型语言模型、检索增强生成、多模态大模型以及AIGC等最新AI算法技术,全方位赋能电商业务。淘天算法团队将这些技术运用到平台搜索、商品推荐、场景营销、商家经营等关键环节中,不仅提升了淘宝天猫平台的运营效率,还为“AI淘宝”注入了更多科技动能。
在当今快节奏的互联网环境中,交易系统的复杂性和高要求给研发团队带来了前所未有的挑战。从问题排查的低效到测试数据构造的繁琐,再到团队经验的流失,每一个环节都可能成为研发效率的瓶颈。本文将探讨如何利用AI技术,特别是AI Agent,来破解这些难题,提升研发效率。通过具体的案例和实践,我们将看到AI Agent如何在问题排查、测试数据生成和知识传承等方面发挥重要作用,成为工程师们高效工作的“神队友”。
CLR集成为SQL Server提供了强大的扩展能力,突破了T-SQL的限制,极大地拓展了SQL 的应用场景,如:复杂字符串处理、高性能计算、图像处理、机器学习集成、自定义加密解密等,使开发人员能够利用 .NET Framework的丰富功能来处理复杂的数据库任务。
本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理,并解释了为什么会导致这些问题,接着我们利用CoT(思维链)方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因,最后提出【理由先行】风格这一简单有效的Prompt Trick。
本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。
随着移动端(手机/平板等)算力、内存、磁盘空间的不断增长,在移动端部署大模型逐渐成为可能。在端侧运行大模型,可以有一系列好处:去除网络延迟,加快响应速度;降低算力成本,便于大规模应用;不需数据上传,保护用户稳私。
随着大模型发展的不断深入,我们越来越关注到语料质量对模型能力的影响,语料中的偏差和主观性会导致生成内容不准确或带有偏见。智能引擎事业部是阿里内部深耕多年的AI工程团队,为内部业务提供了完整的大模型工程体系,持续关注大模型训推性能、成本、研发范式等关键问题。本文将基于我们的思考,探讨大模型语料的复杂性及其背后的思维过程。
本文作者基于自身在RAG技术领域长达半年的实践经验,分享了从初识RAG的潜力到面对实际应用挑战的心路历程,以及如何通过一系列优化措施逐步解决这些挑战的过程。