集群服务暴露的需求来自 Kubernetes 服务的虚拟化和网络隔离。众所周知,Kubernetes 的 Pod 是动态的,可能会频繁的删除、重建,重新调度到不同的节点,IP 地址也会随之变化。Kubernetes 使用 Service 来提供访问 Pod 的稳定接口,实现对服务的抽象。 Service 为 Pod 提供了一个稳定的 DNS 名称和虚拟 IP 地址,而不依赖于 Pod 的临时 IP。因此在集群内部的通信,通过 Service 的 ClusterIP 访问完全不存在问题。 不过 Service 的 ClusterIP 只能在集群内部访问,外部无法直接访问。Service DNS 名称的解析,只能在集群内部进行。这种网络隔离作为网络保护机制,确保 Pod 和 Service 的访问受限于集群内部。 然而,我们在实际应用中,往往需要将服务暴露到集群外部,以便外部用户访问。这时,我们就需要额外的组件来实现集群服务的暴露。尤其是在一些高级应用场景下,如多集群、多云等,更需要一种灵活、动态的方式来暴露集群服务。
本文介绍了百度针对海量存储数据计算需求研发的HTAP表格存储系统及计算调度架构。项目背景源于原有存储系统难以满足日益增长的OLAP业务需求,因此构建了集OLTP与OLAP于一体的HTAP系统,通过存算分离、Serverless设计等创新点提升IO访问能力和资源利用率。同时,自研的计算与调度系统实现了任务开发的SQL化和数据处理的FaaS化,简化了业务使用成本,提高了开发效率。整体方案在存储成本、IO能力、IO放大率等方面取得显著成果,为海量存储数据的计算提供了高效、灵活的解决方案。
随着人工智能技术的快速发展,尤其是在自然语言处理(NLP)、计算机视觉和生成对抗网络(GANs)等领域,AIGC(AI Generated Content)得到了广泛应用,这一技术的进步使得内容创作变得更加高效与多样化,推动了各个行业的创新与变革。对于测试而言,基于AI进行测试用例生成也逐渐从梦想变成现实。
我们是淘天业务技术内容AI团队,负责运用最新的生成式AI能力,挖掘淘宝核心用户场景(首页信息流、搜索、用增、消息等)的用户痛点问题,通过AIGC内容生成、智能交互等方式,改善用户购物体验,降低平台&商家经营门槛。团队主要研究可控内容生成、多模态大模型、人格化Agent等技术域,在图像生成、视频生成、多模态大模型等前沿技术领域有广泛的布局,并在巨浪、信息流、搜索等淘天核心内容业务场景进行深入的业务合作。团队近3年内团队已累计发表CCF-A类会议和期刊论文20余篇,包含CVPR、ICCV、NeurIPS、ICLR等业界顶会。 仅在刚公布的AAAI 2025,我们就一举斩获了4篇论文,涵盖参考图控制生成、图文联合生成、大语言模型等核心前沿技术领域。我们诚挚欢迎优秀人才关注和加入!下面介绍在即将过去的2024年,团队录用论文情况。
Serverless是云计算的进一步延伸,因此其继承了云计算的最大特点,即按需弹性伸缩。这样的模型设计让开发者无需关注具体的部署资源,充分利用资源规模效应,提供更好的弹性能力,也能让企业切实享受到真正的按需使用特征。正因如此,更多的云厂商们不约而同地转向Serverless这一新的架构设计理念。 “灵活可配置”作为Serverless技术的弹性核心能力之一,所关注的是“通过简单、少侵入、灵活可配置的方法让具体用云场景能充分使用弹性资源”。其本质是解决了容量规划与实际集群负载配置间的矛盾。本文将依次介绍 ElasticWorkload[1]、WorkloadSpread[2]、UnitedDeployment[3] 和 ResourcePolicy[4] 这四种资源可配置插件,详细探讨它们的核心能力、技术原理与优劣势,以及在真实场景中的应用。通过这些内容分享阿里云容器服务在应对 Serverless 负载弹性问题时的技术演进和思考。
推荐系统的模型,通过学习用户历史行为来达到个性化精准推荐的目的,因此模型训练依赖的样本数据,需要包括用户特征、服务端推荐的视频特征,以及用户在推荐视频上是否有一系列的消费行为。 推荐模型数据流,即为推荐模型提供带特征和优化目标的训练样本,包括两个模块,一是Label Join模块,负责用户行为的采集。二是feature extract模块,从原始日志中抽取特征,并基于用户行为计算模型优化的目标label。 在B站早期的推荐模型数据流架构中,如下图所示,采样两阶段特征补齐设计。Label Join模块除了完成用户行为的采集,还需要查询实时特征,补齐训练样本依赖的部分原始特征数据,一般是秒级更新的实时特征,存储在Redis中。而Feature Extract模块在计算样本之前,补齐另外一部分原始特征数据,一般是批量更新的特征数据,存储在KFC中(B站自研的KV系统)
本文介绍了Serverless高可用架构方案,当企业面对日益增长的用户访问量和复杂的业务需求时如何实现更高的灵活性、更低的成本和更强的稳定性。
内存泄漏一直以来都是程序员无法回避的话题,但是其实你想在 Flutter 的 Dart 层面里真的制造出「完全无法回收」内存泄漏,其实也并不是那么容易。