直播业务具有实时性强,复杂度高,排查链路长,影响面大等特征,线上问题如果不能立刻排查处理,分分秒秒都在影响用户的观看体验、主播的收入。 但各端的问题可能都只是表象,例如,一个看似简单的画面卡顿问题,可能涉及到编码器配置、网络带宽分配、服务器负载等多个方面,各个团队经常在等待合作方的反馈,一整套流程下来,一个线上问题的定位可能要消耗掉数小时的人力。 我们迫切的需要一套高效的跨端实时排障系统!
本文阐述了阿里云表格存储(Tablestore)如何通过其向量检索服务应对大规模数据检索的需求,尤其是在成本、规模和召回率这三个关键挑战方面。
在上一篇《 9 本醍醐灌顶的计算机好书》推文中,我们分享了腾讯程序员们强烈推荐的计算机经典图书,涵盖了计算机理论科学、软件工程等帮助程序员夯实地基的基础知识。这些基础知识,是程序员在今后的职业生涯中,赖以生存的核心竞争力之一。 但正如取经路上的劫难各不相同,程序员也很难靠一套棍法解决所有问题。于是,这期我们推荐的书籍,是能帮助程序员实现阶层跃迁、视野开拓、站位升维的“道之书”。希望大家在追求技术极致的同时,也能跳出技术的局限,用更高维的视角去剖析问题的本质,用更极致的技术构建问题的解法。
近年来,高等教育不断受到社会的审视和质疑。学习成为以追求绩点为中心的理性经营,师生关系异化,兴趣社团、实习等课外活动越来越成为经营履历的工具化过程,大学充斥着向上社交和混圈子。在「问题青年」播客第106期节目《我是大学生,我对大学感到失望》中,还在读大三的燕麦奶同学锐评大学课堂成了“空洞的表演”,大学远离了智识追求的理想,成了“社会权力结构的预演舞台”。 大学生本能地把 AI 带进校园,让 AI 帮自己听课、看文献、写论文。这引起了一些人的担忧,称大学校园被 AI “入侵”。 今天,AI 进入校园已经势不可挡。我们在《AI能让大学生摆脱“无意义学习”吗?》中分享了大学生对 AI 的十个问题。其中一半以上的问题都与学习方式的改变有关。AI 会影响我们如何学,学什么,认为什么值得学。
本文将基于火山引擎客户服务实践和字节跳动内部技术实践,介绍利用云原生技术稳定支撑百万 QPS 广告业务、在云资源消耗上实现极致性价比。
传统实验引擎基于单一实验单元、普通随机分组、大样本和个体独立性,适用于单边场景实验,但在多边场景中显得不足。此外,多边场景中溢出效应成为常态,进一步挑战了传统方法的适用性。针对这些挑战,本文提出了新方案可作为有用的指南,帮助实验平台建设者应对开发中的挑战,并采用不同方法确保实验的可靠性和高效性。
RTP-LLM是阿里巴巴智能引擎团队推出的大模型推理框架,支持了包括淘宝、天猫、闲鱼、菜鸟、高德、饿了么、AE、Lazada 等多个业务的大模型推理场景。RTP-LLM与当前广泛使用的多种主流模型兼容,使用高性能的 CUDA kernel, 包括 PagedAttention、FlashAttention、FlashDecoding 等,支持多模态、LoRA、P-Tuning、以及WeightOnly 动态量化等先进功能,已在众多LLM场景中得到实际应用与检验。 本篇文章介绍了RTP-LLM的整体架构,并着重分析了模型加载过程中的核心部分:模型的权重和配置文件。本文主要由社区用户mingming贡献,特此感谢其对项目的支持。
过去几年的开发生涯,我一直都在思考 技术成长/核心竞争力 这些命题。 程序员这个行业面临的年龄危机和焦虑感是前所未见的,这些命题也将伴随程序员的整个职业生涯。在计算机软件工程的一些经历著作里面,前辈们也给出了不少关于这些方面的参考。但正如你无法只通过阅读理论而学会游泳一样,正如好的架构设计是慢慢地从解决问题和大量实践中生长出来的一样,真正的答案需要在大量的项目经验和编码实践中不断寻找。 我想,我的答案可能都藏在过程里面。作为一名非典型的前端开发,无论是在初期转做服务端开发工程师,还是负责开发亿级流量的前端监控接入层服务,又或是前端开发经历,虽说走了不少弯路,但都锻炼了我的技术能力,拓宽了我的技术视野,并且带给我很多解决问题的思维。 对于技术需要怎么具体地去学?项目需要怎么具体地去做?这些竞争力是不是能伴随我们度过 35 岁的门槛?希望我能通过这篇文章的复盘给出一些答案,同时能给各位读者一些启发。让我们一起共同面对这高悬头上的达摩克利斯之剑。