管理团队是一件非常困难的事情,在认知能力强的群体中尤其如此。历史告诉我们,缺乏组织的人类群体没有任何战斗力,且在社会化生产的过程中效率非常低下。 在一些公司中,管理问题时时刻刻存在。这些公司要么靠管理者的本能管理,要么靠经验性的管理框架来管理。在 IT 团队中尤其明显,这是因为技术管理者往往更关注技术本身而非管理。 有意思的是,管理能不能也用 “技术的语言”来表述呢?其实是可以的,作为一个分布式系统的爱好者,我慢慢发现分布式系统和团队管理有一些共通之处,且能用这些发现解决一些问题。这些问题对于管理者和团队成员都有一些启示,希望您能耐心地看下去。
在文章的开头,我们可以先来了解一下直播业务的大致业务架构。将直播业务简单分为两大类场景"看播"、"开播",前者主要面向C端观看用户,后者主要面向B端开播主播。主播通过"开播工具"的开播产品功能,经由"开播平台"完成一系列开播动作,最后将媒体信息采集推送到多媒体服务器,C端观看用户就可以从CDN看到直播的视频流内容。 从数据流向来讲,"开播"场景是产生数据和触发关键事件的源头。这些数据或事件会涉及多个领域,如安全合规信息、房间信息、主播信息、开播场次信息、安全审计信息、多媒体信息等。 打个不太准确的比喻。开播系统对于直播平台的重要性,等同于订单系统对于交易平台的重要性。开播工具作为播端功能入口,直接面向官方开播工具(直播姬、粉版大加号、三方工具如OBS开播)的用户以及内部平台方的用户(其他业务线、产品&运营),对开播体验负责。开播平台在其中的职责,是向开播工具和其他平台方提供开播相关的平台化业务能力,如开关播、开通直播间、切换分区等。
今天给大家带来一个非常让人兴奋的话题,云原生全栈可观测。 业务系统具备良好的可观测性,是最容易让开发者、运营者和管理者兴奋的。为什么这样讲?当开发者做了非常棒的业务功能,把它发布上线,此时如果它是黑盒的,或许大家都感受不到更多的成就感。当研发同学能从一个观测大盘上看到业务功能有多少 PB 流量引入,业务系统稳定运行,资源消耗平稳且符合预期;业务运营同学可以看到目前有多少用户访问,用户的行为轨迹,产生了多少业务订单。这个时候才是让大家真正的安心和兴奋。 回归本质,这就是全栈观测最基本的诉求。 回首过去几年,可观测伴随着整个云原生技术发展。Gartner 将 Applied Observability 列为 2023 年战略技术趋势,并预计,2026 年 70% 成功应用可观察性的组织将实现更短的决策延迟,为目标业务或 IT 流程带来竞争优势。 基于多年的实践经验和技术积累,阿里云发布 ARMS 全栈可观测产品体系,帮助企业更快、更低成本的完成全栈可观测技术栈的构建。