程序员最大的幸福是看到自己的代码跑在千万人的设备上,程序员最大的不幸是去维护千万人设备背后的老代码。腾讯新闻,是一个有着十多年历史、海量用户规模的经典业务,其背后的系统走过了门户时代,走到了推荐算法时代。 随着时间的推演,老旧架构面临着那些经典的问题:可用性差,服务不稳定;扩展性差,开发周期长,迭代效率低;200 多个代码仓库,300 多万行代码,编程语言、协议混用…… 叠加上推荐算法的时代命题,如何对腾讯新闻的推荐架构做升级成了业务进一步发展的内在要求。本文从业务场景介绍入手,详细介绍了腾讯新闻推荐架构升级过程中的目标设定,架构设计和实践过程,值得仔细品阅,转发点赞收藏一键三连。
哈啰作为一家出行互联网公司,定位这种基础能力是深度融入在各业务的核心链路中的,笔者所在的地图团队经常会收到定位相关的badcase,但苦于定位的复杂与较难回收出价值,一直没有针对性去解决此类问题,那在各大互联网厂商都在做下沉市场注重用户体验的今天,我们重新捡起了这个话题。
随着现代软件架构的不断发展,越来越多的企业对系统架构进行了微服务化与容器化改造,从而更好地满足海量并发、高可用、弹性伸缩、快速迭代等需求。然而,微服务化与容器化的引入也让分布式系统的复杂度随之增加,使得系统的监控和管理变得更加困难。 因此,应用性能监控(Application Performance Management,简称 APM)工具的重要性就体现出来了,特别是 APM 提供的分布式链路追踪能力,可以帮助开发者快速发现并定位性能问题,是分布式系统稳定运行的重要保障。将分布式应用接入 APM 工具,还能提高系统性能以及稳定性。
本文旨在介绍精准测试模型原理与多维表格工程的应用,部分代码细节和算法释义不在正文中推导&聚焦,相关同学有兴趣可以阅读原文评论区交流。
Master-Worker 架构是成熟的分布式系统设计模式,具有集中控制、资源利用率高、容错简单等优点。我们数据中心内的几乎所有分布式系统都采用了这样的架构。 我们曾经发生过级联故障,造成了整个集群范围的服务中断。这让我们反思到 Master-Worker 架构难以有效的分批灰度发布的问题。本文试图分析其中原因,并尝试提出几种解决方案。
过去的一年多,大模型风起云涌,不断迭代,作为一个多年 NLP 产品方向的从业者,可以说是享受其中,惊喜连连。记得22年底,那时疫情放开,身边的人全部病倒,在身体冷热交加中看到了 ChatGPT 的发布,马上在病榻上完成了注册,那时的感觉就仿佛黑暗中看到了曙光。当时我在一家物联网公司的 AI 研究院工作,基于 ChatGPT 开始设计很多 demo 取代之前的 NLP 任务 bert 方案,后面一年多不断地实验各种大模型的应用方法,颇为有趣。 腾讯日前也正式发布了大模型应用平台元器和混元 C 端产品元宝,也希望大家一起在上面多做一些有意思的智能体,故分享一下之前的探索经验,供大家参考。
JavaScript 的生态系统一直以它的变化速度飞快而著称。在今天快速变化的 JavaScript 框架生态中,稍不留神你就可能错过许多新东西。每当你觉得自己对最新的工具和技术驾轻就熟时,新的创新浪潮又会带来一切改变。 去一年,JavaScript 框架生态又发生了不小的变化,在今年的 Google I/O 开发者大会中,《Navigating the JavaScript framework ecosystem》 主题向我们整理和介绍了我们应该关注的重点内容。
在直播、电商等业务场景中存在着大量实时数据,这些数据对业务发展至关重要。而在处理实时数据时,我们也遇到了诸多挑战,比如实时数据开发门槛高、运维成本高以及资源浪费等。 此外,实时数据处理比离线数据更复杂,需要应对多流JOIN、维度表变化等技术难题,并确保系统的稳定性和数据的准确性。本文将分享基于存储的实时数仓架构在不同业务场景的实践经验,以及该架构带来的收益。
APISIX 被越来越多的用户选择作为 IT 应用系统的入口,由于故障定界能力的缺失,在 IT 业务故障诊断过程中,APISIX 经常成为重点“怀疑对象”,一方面“劳师动众”投入大量运维人力定位,另一方面诊断方向“南辕北辙”,因而业务故障“久拖不决”。通过本篇文章复盘重现某全球领先的智能终端提供商近期对核心业务响应时延劣化故障的处理过程,您将直观了解到“南辕北辙”现象对诊断效率的决定性影响,以及 DeepFlow 可观测性平台如何用数分钟时间、几步简单操作,消除 APISIX 故障诊断中的“南辕北辙”,解决长达两个月悬而未决的问题,为故障处置效率带来飞跃提升。