文库

文库
字符
转换
加密
网络
更多

图表

数学

坐标

图片

文件
文库

字符

转换

加密

网络

更多

图表

数学

坐标

图片

文件

在线工具大全

所有

中文

英语

最新

热度

4933 条查询结果

一文搞懂：RAG、Agent与多模态的行业实践与未来趋势

大模型作为产业变革的核心引擎。通过RAG、Agent与多模态技术正在重塑AI与现实的交互边界。三者协同演进，不仅攻克了数据时效性、专业适配等核心挑战，更推动行业从效率革新迈向业务重构。本文将解析技术演进脉络、实战经验与未来图景，为读者提供前沿趋势的全局视角与产业升级的实践指引。

腾讯技术

3 技术 lddgo 分享于 2025-04-24

深入解析 Gateway API Inference Extension（推理扩展）

在 Kubernetes 上运行 AI 推理工作负载具有一些独特的特点和挑战，Gateway API Inference Extension 项目旨在解决其中的一些问题。我最近在 kgateway 项目[1] 中写过关于这些新能力的文章，而本文将深入讲解其工作原理。大多数人将 Kubernetes 中的请求路由理解为基于 Gateway API、Ingress 或 Service Mesh（统称为 L7 路由器）的机制。这些实现的原理类似：你定义一些根据请求属性（如 header、path 等）进行匹配的路由规则，L7 路由器会基于这些规则决定请求应发送到哪个后端，并使用某种负载均衡算法（如轮询、最少请求、环哈希、区域感知、优先级[2] 等）。

kubernetes

2 技术 lddgo 分享于 2025-04-24

限流系列之四：TDMQ RocketMQ 版限流机制详解与实践教程

随着分布式系统架构的普及，消息队列已成为支撑大规模、高并发在线业务的核心组件之一。TDMQ RocketMQ 版作为一款高性能、高可靠的消息中间件，通过提供稳定、低延迟的消息服务，帮助企业轻松应对业务洪峰、实现系统解耦。然而，在高并发、大流量场景下，如何合理分配资源、防止系统过载成为保障服务稳定性的关键。为此，TDMQ RocketMQ 版引入了分布式限流机制，通过动态调整客户端的发送与消费速率，确保集群在高负载情况下依然能够稳定运行。本文将详细解析 TDMQ RocketMQ 版的限流机制，包括限流行为和限流实现原理。同时，结合实际案例，提供客户端实践教程，帮助开发者更好地理解并应用限流机制，避免因集群流控导致的业务受损。

腾讯技术

2 技术 lddgo 分享于 2025-04-24

自主构建MCP，轻松实现云端部署！

本文以阿里云百炼上的工作流为例，将其封装成MCP服务并部署到阿里云百炼，随后引入智能体中，从而可以在智能体内使用自定义的MCP服务。今天我们先介绍其中一种方式。1. 编写代码封装MCP服务。2. 将封装后的服务发布到npm官方平台。3. 在阿里云百炼平台中创建自定义的MCP服务。4. 在智能体中引用自定义的MCP服务。

阿里巴巴技术

2 技术 lddgo 分享于 2025-04-24

结构化提示词驱动开发实践

最近有幸参加了公司组织的关于AI实践的对外直播，我分享的内容是《结构化提示词驱动开发实践》。现在将其记录成一篇博客，在此与大家分享我们团队在提示词驱动开发领域的一些实践与思考。随着大语言模型的不断成熟，我们逐步认识到，如何高效运用结构化提示词，引导AI生成高质量代码，已成为提升软件开发效率与质量的关键所在。本文将围绕“结构化提示词驱动开发”这一主题，从设计理念、实践路径到治理策略，全面解析提示词在软件开发中如何落地应用，并以数据与实例展示其显著成效。

1 技术 lddgo 分享于 2025-04-24

MCP 实践：基于 MCP 架构实现知识库答疑系统

业界推测 2025 年是 AI Agent 的元年，从目前的技术发展速度看确实是有这个趋势。从年初 DeepSeek 的爆火开始，目前开源大模型的能力基本与商业大模型拉齐甚至是超越，完全开放的开源策略让大模型的使用彻底平权。这个可以说在某种程度上改变了 AI 应用的商业模式，基于自训练的闭源模型的优势被显著削弱，商业竞争从模型性能转向对应用场景的创新。 AI 应用的形态不断演进，从早期的 Chat 到 RAG，再到现在的 Agent。参考 Web 2.0 和移动互联网时代的技术发展，当某种新形态的应用开发需求爆发式增长，会催生新的开发框架和新的标准的建立，AI 应用正在经历这个过程。目前开发框架还处于百花齐放的状态，Python 是否会成为主流开发语言，哪个开发框架会成为主流，这些都还未知，有待观望。但是近期比较火热的 MCP（Model Context Protocol）看起来已成事实标准，特别是近期 OpenAI 也官宣了对 MCP 的支持。关于 MCP 的介绍不在本文赘述，本着学习的目的，动手做了一个实践，主要为了体验如何基于 MCP 开发一个 Agent 应用。本次实践会实

阿里巴巴技术

11 技术 lddgo 分享于 2025-04-23

深入微服务核心：从架构设计到规模化

Building Microservices》这本书是吃透微服务的大部头，本文基于全书内容，系统性地阐述了微服务架构的设计原则、实施策略与挑战，从微服务的核心概念出发，延伸到架构设计、服务拆分、集成技术及规模化实践，为开发者提供了构建稳健微服务体系的指导框架。

腾讯技术

8 技术 lddgo 分享于 2025-04-23

通俗的解释大语言模型是怎么工作的？

我相信你也会同意，现在已经无法忽视生成式 AI（Generative AI，简称 GenAI）了。关于大语言模型（Large Language Models，LLMs）的新闻铺天盖地。你很可能已经用过 ChatGPT[1]，甚至一直把它开着当助手用。但很多人心中有一个基本疑问：这些模型看上去“很聪明”，这种“聪明”到底是从哪儿来的？这篇文章就是想用简单的方式、尽量不涉及复杂数学，来解释文本生成模型是如何工作的，帮助你把它们当作计算机算法来理解，而不是神奇魔法。

7 技术 lddgo 分享于 2025-04-23

支付宝小游戏宿主性能优化

阿里巴巴技术

3 技术 lddgo 分享于 2025-04-23

读书笔记：淘宝十年产品与技术演进史

本文是对《淘宝十年产品事》与《淘宝技术这十年》两本书的阅读笔记总结。通过回顾淘宝过去十年在产品、技术、架构、中间件及开放平台等方面的发展历程，展现了其从初期到成熟阶段所经历的关键决策、问题解决策略以及创新设计。文章不仅梳理了淘宝在电商生态中的角色演变，还深入探讨了业务与技术之间的相互驱动关系。通过对历史的探究，我们得以了解前人的智慧与经验，为未来的发展提供启示与借鉴。

阿里巴巴技术

4 技术 lddgo 分享于 2025-04-23

简体中文