Library

ARTICLE
STRING
CONVERTER
ENCRYPT
NETWORK
MORE

CHART

MATH

COORDINATE

IMAGE

FILE
ARTICLE

STRING

CONVERTER

ENCRYPT

NETWORK

MORE

CHART

MATH

COORDINATE

IMAGE

FILE

Online Tools

All

Chinese

English

Newest

Hottest

154 search results

2024年【百度Geek说】年终总结汇报

百度技术

71 Technology lddgo Shared on 2025-01-13

百度视频搜索架构演进

随着信息技术的迅猛发展，搜索引擎作为人们获取信息的主要途径，其背后的技术架构也在不断演进。本文详细阐述了近年来视频搜索排序框架的重大变革，特别是在大模型技术需求驱动下，如何从传统的多阶段级联框架逐步演变为更加高效、灵活的端到端排序框架。

百度技术

65 Technology lddgo Shared on 2025-01-08

网页结构建模在低质采集站上的识别应用

百度搜索是全球最大的中文搜索引擎，拥有着几十亿级的流量，作弊团伙通过各种各样的手段妄想从巨大的流量中不劳而获。搜索反作弊团队维护百度搜索生态安全和质量，经过不断探索并利用前沿技术过滤低质作弊网页，保护真正付出劳动的站长的利益。本文介绍了基于MarkupLM的网页建模方式，引入XPath embedding自动化提取作弊页面结构特征，并与文本结合来进行采集站点识别。

百度技术

75 Technology lddgo Shared on 2025-01-06

海量存储的批量计算框架

本文介绍了百度针对海量存储数据计算需求研发的HTAP表格存储系统及计算调度架构。项目背景源于原有存储系统难以满足日益增长的OLAP业务需求，因此构建了集OLTP与OLAP于一体的HTAP系统，通过存算分离、Serverless设计等创新点提升IO访问能力和资源利用率。同时，自研的计算与调度系统实现了任务开发的SQL化和数据处理的FaaS化，简化了业务使用成本，提高了开发效率。整体方案在存储成本、IO能力、IO放大率等方面取得显著成果，为海量存储数据的计算提供了高效、灵活的解决方案。

百度技术

78 Technology lddgo Shared on 2024-12-30

网页多模态建模思考

本文从网页理解业务出发，从多模态信息融合，预训练任务构建角度，探讨通用网页建模方案。首先，指出网页的特殊性，即从不同观察视角下，网页存在富文本、树形结构，和图层堆叠三种形态。在此基础上，对比了多种多模态融合思路的优缺点，给出一种较好的方案。进一步，提出多粒度、多维度的网页预训练方案；最后，探索了大模型时代，利用现有多模态模型，低成本的适配到网页的一种可行思路。

百度技术

76 Technology lddgo Shared on 2024-12-25

MEUX 「十二月」 AI设计观察

【1】谷歌发布AI大模型Gemini2.0 【2】Android XR迎来Gemini时代【3】OpenAI发布会发生了什么【4】腾讯版Sora发布即开源【5】豆包支持在图片生成中文【6】Kimi上新抢先实测视觉思考模型k1 【7】360集团发布创作引擎纳米搜索【8】iOS 18.2更新：Siri接入ChatGPT 【9】蛇年春晚吉祥物「巳升升」发布【10】潘通发布2025年度代表色：摩卡慕斯

百度技术

73 Technology lddgo Shared on 2024-12-25

初探图谱Embedding用于异常检测（一）

本文探讨了图谱Embedding在业务安全与反作弊等关键业务场景中的应用，特别是在异常检测方面。传统的统计方法在面对复杂多变的攻击场景时显得力不从心，因此本文介绍了一种基于One-Hot编码的图谱Embedding算法GEE，通过标签传播实现结点特征的表达。作者还通过两篇论文的代码验证，发现稀疏矩阵改进版算法在测试数据集上性能不佳，并进一步优化了算法，使其在计算效率上有所提升。本文对于利用图谱数据进行异常检测的研究和实践具有一定的指导意义。

百度技术

64 Technology lddgo Shared on 2024-12-18

AIAPI - 转向AI原生检索

百度技术

66 Technology lddgo Shared on 2024-12-16

AI Agent重塑微服务治理

随着技术架构的发展，微服务系统的复杂性不断增加，对运维提出了更高的要求。为了应对这一挑战，一种AI驱动的微服务治理方案被提出。该方案采用多智能体架构，将运维专家经验整合，并通过自然语言交互和智能推理，简化了灰度发布和配置限流熔断等操作。利用大型语言模型（LLM）的推理能力，方案能够进行深入的故障诊断和处理，实现运维经验的自动化。每个智能体都能承担特定角色，高效完成复杂任务，并通过持续的数据训练和SOP提炼，不断优化功能，满足用户需求。在数字时代，AI为微服务治理开辟了新的可能性。

百度技术

72 Technology lddgo Shared on 2024-12-04

MEUX 「十一月」 AI设计观察

【1】百度2024世界大会重磅发布新应用【2】谷歌AI多场景覆盖教育、科研等领域【3】即梦AI首发Seaweed开放使用【4】小爱升级，支持多端设备“音乐问答” 【5】无需顶级显卡，轻松生成高清大图【6】X平台免费开放AI聊天机器人Grok 【7】腾讯元宝发布2.0版本【8】昆仑万维SkyReels AI短剧平台在美国上线【9】AI图像生成平台LiblibAI上线PC客户端【10】FLUX.1-dev LoRA服装生成器来了

百度技术

71 Technology lddgo Shared on 2024-11-27

English