ITIL 是一套 ITSM 最佳实践体系,能够提高 IT 部门用户满意度和运行效率。它提供了针对 IT 活动的实践,可以被组织应用于战略、价值交付和能力维持。它允许组织建立一个基线,用于计划、实施和测量,证明合规性和衡量改进。虽然 ITIL 建立了 ITSM 的“游戏规则”,但它只告诉你最好做什么事,具体落地层面的流程实践需要根据不同的组织进行定制化和优化。 本系列 IT 运维服务管理的文章,基于我们过去在不同项目背景下总结出来的实践经验,具有运维服务管理落地指导性质。它为项目稳定运营提供奠项目运维开展计划的基础,为进一步的工程实践和持续优化奠定良好的基础,同时可以帮助运维项目中的人员完善和提升项目运维过程中的服务管理能力。 本系列文章的主题包括运维安全管理、事件管理、变更管理、应急预案、自动化效率化运维。本文为第一篇:运维中的安全管理。 在企业的 IT 服务运维管理中,安全管理是一个非常重要的问题。在产品运维过程中,不仅需要管理、维护和监控 IT 系统的可靠性,同时系统的安全性也是非常重要的。当谈到运维安全管理时,我们最容易想到的是保护敏感信息和数据安全。
阿里巴巴智能引擎事业部自研的 Khronos 系统是阿里内部接入规模最大的性能数据存储引擎。Khronos 支持动态生命周期的存储计算分离架构,采用 schemaless 的 data model 设计,在万亿数据规模下为业务提供易用、高效、经济的服务,团队近期的优化工作也被国际学术会议CIKM2023收录。本⽂总结了Khronos 在性能监控领域遇到的技术挑战,以及在这个场景下的一些价值判断。
性能优化是个恒久的话题,随着产品的演进,业务的增长,系统能力总有达到瓶颈的一天,它不可或缺的陪伴着我们走向壮大再走向衰败,是我们面临的不可回避的问题。下图1展示了风控系统近半年来承载流量的增长趋势,可见最近半年来流量高速增长,且对于可预见的未来而言,接入流量还会持续高增。伴随着流量的增长,系统各方面--存储、计算、IO等都表现出一定的瓶颈,通过原始简单的水平扩容并不能解决所有的问题,而且还会带来成本的上升。因此,我们近期对系统进行了一系列优化改造, 目的是满足未来一段时间内业务的增长使用,降低接口的耗时满足某些延时敏感型业务的需要,同时也伴随着一定的IT成本优化。本文结合常见的性能优化手段(预取、批量、异步、压缩、缓存),及在风控系统中的实践进行总结,希望能给读者对于性能优化实践带来一些参考。
当涉及到企业分析场景时,所使用的数据通常源自多样的业务数据,这些数据系统大多采用以行为主的存储结构,比如支付交易记录、用户购买行为、传感器报警等。在数仓及分析领域,海量数据则主要采按列的方式储存。因此,将数据从行级转换成列级存储是建立企业数仓的基础能力。 传统方式是采用Extract-Transform-Load (ETL)来将业务数据转换为适合数仓的数据模型,然而,这依赖于独立于数仓外的ETL系统,因而维护成本较高。但随着云计算时代的到来,云数据仓库具备更强扩展性和计算能力,也要求改变传统的ELT流程。 火山引擎ByteHouse是一款基于开源ClickHouse推出的云原生数据仓库,为用户提供极速分析体验,能够支撑实时数据分析和海量数据离线分析,同时还具备便捷的弹性扩缩容能力,极致分析性能和丰富的企业级特性。凭借其强大的计算能力,可以全面支持Extract-Load-Transform (ELT)的能力,从而使用户免于维护多套异构系统。
火山引擎ByteHouse 是一款基于开源 ClickHouse 推出的云原生数据仓库,本篇文章将介绍 ByteHouse 团队如何在 ClickHouse 的基础上,构建并优化 ELT 能力,具体包括四部分: ByteHouse 在字节的应用 ByteHouse 团队做 ELT 的初衷 ELT in ByteHouse 实现方案及未来规划。
贴吧较长时间以来,用户通过点赞、@、回复方式进行互动,异步互动方式存在时间差,用户不能得到及时反馈会导致互动意愿消减,群聊可以弥补异步互动的不足,为用户提供更实时高效互动方式,提升用户互动次数、时长、留存数据,进而提升产品DAU。 贴吧等社区产品通过垂类内容将用户聚合在一起,用户在其中讨论诸如追星、游戏、体育、生活等话题,群聊同样是一种兴趣聚合方式,结合群聊高效的互动能力可以放大垂类兴趣优势。
当谈论如何提升视频的体验时,我们需要明确互联网视频市场的背景和现状,并分析用户对于视频体验的期望和挑战。 首先,随着移动网络的普及和互联网带宽的不断提升,视频观看已成为互联网的主要应用之一,视频内容也涉及更多的领域,例如教育、电商、社交等。同时,视频流量的份额也逐渐扩大,占据着互联网流量的重要部分。可是,面对海量的视频内容,用户们提出了越来越高的要求,如需要更快的加载速度、更流畅的播放体验、更高的画质和分辨率等,这些要求又产生了一系列挑战。 其次,不良的网络环境和设备所带来的影响也是视频体验不理想的重要原因之一,例如网络延迟、带宽瓶颈、设备性能等,这些因素都可能导致视频的卡顿、画面模糊、下载速度慢等质量问题。此外,由于网络环境的差异和视频内容的多样性,保障用户体验变得更加复杂,需要针对不同的用户需求和设备特性,采用不同的优化方案和技术手段。 针对这些问题,我们需要梳理出优化视频体验的技术手段和测试角度,以提高视频的质量和用户的满意度。并通过不断的优化落地,最终来提升视频体验并提高市场竞争力。
互联网发展早期,业务场景差异大,试错迭代速度很快。这导致其后台服务使用的语言技术栈、开发框架、通信协议、服务治理系统、运维平台等或多或少存在差异。 业务发展到一定阶段后,跨业务合作越来越多,组织架构调整也愈发频繁。技术体系差异,特别是开发框架的不统一,给业务互通带来巨大成本,也导致开发和运营的效率难以快速提高。 同时,随着云原生技术的发展,业务越来越多地使用开源技术和云组件。拥抱云原生已经是一种主流趋势。 上述问题在腾讯内部也同样存在,且因为规模大、业务类型多,更加难以解决,更必须解决。tRPC 就是在这种背景下诞生的。