语音识别服务除了语音识别声学模型以外,还包含很多对于实践应用非常关键的技术模块:语音端点检测、标点预测、逆文本正则化(ITN)等。进一步的,语音识别声学模型也包含很多配套的子技术模块,例如热词定制化技术、时间戳预测等。本小节会介绍通义实验室过去一年在语音识别声学模型、语音端点检测、语音识别热词定制化和时间戳预测上最新的研究和应用进展。
淘宝创新业务的优化迭代是非常高频且迅速的,在这过程中要求技术也必须是快且稳的,而为了适应这种快速变化的节奏,我们在项目开发过程中采用了一些面向拓展以及敏捷开发的设计,本文旨在总结并思考其中一些通用的编程模式。
正如图中调侃的衡量代码质量的唯一有效标准就是CodeReview过程中WTF/min,从中可以看出CodeReview对于保障代码质量的重要性。 CodeReview在日常的开发过程中也越来越被重视,它在提高代码质量同时促进团队成员之间的知识共享和技能提升方面发挥了诸多作用,本文将主要围绕CodeReview展开,简单聊聊在CodeReview过程中的心得和思考。
今天,容器和 K8s 已经成为应用研发运维的新标准,行业调研数据显示,2022 年有 64% 的最终用户在生产环境中使用了 K8s;2022 年托管在云上的 K8s 集群增速达到了 127%。我们也看到云托管的 K8s 将在 2023 年超过本地部署。这意味着容器化上云成为了新常态。 同时,随着互联网分布式技术的普及,微服务架构被广泛使用,围绕着一整套的技术体系,运维复杂度陡然上升。在这两个趋势之下,我们看到企业和开发者面临新的挑战:比如 K8s 的入门门槛高、维护比较复杂,而微服务的运维体系很复杂,企业的业务流量波动很大,需要更好的按需弹性、同时实现更低成本;云产品组合选择比较多,对于企业来讲需要更好的性价比。 为了解决企业在当下背景下面临的挑战,阿里云带来一款全新的产品:容器计算服务 ACS,将容器和资源一体化,打造出全新的用云范式。
Havenask是阿里巴巴智能引擎事业部自研的开源高性能搜索引擎,深度支持了包括淘宝、天猫、菜鸟、高德、饿了么在内几乎整个阿里的搜索业务。本文针对性介绍了Havenask分布式索引构建服务——Build Service,主打稳定、快速、易管理,是在线系统提升竞争力的一大利器。
本文介绍了如何在自己的 MacBook 上部署一套知识库方案辅助自己的知识管理工作,希望能给每位计划自己搭建大模型知识库应用的工程师一点参考。
Web 的性能优化有很多方法论可以来讨论,这里我先介绍一下飞天服务平台首页的业务背景,以及在业务过程中做的有针对性的优化方法。 最近在做飞天服务平台首页的过程中,遇到的页面打开性能有问题。由于飞天服务平台首页的业务特性:用户可以去配置业务模块到首页,每一个模块都可以去做二级的下钻、抽屉打开去做明细的分析,所以往往一个简单的业务指标呈现,背后带着很多业务数据的二次分析,需要二级页面或者抽屉来呈现这些业务洞察。同时用户可以在首页自定义页面的配置,如果用户配置了 10+ 卡片到首页之后,页面打开的时候同时去加载卡片,对于性能压力有很大的考验。 针对飞天服务平台的业务场景,以及之前性能优化的实践,首先我们会从尽可能缩小资源文件入手,让页面加载尽可能快。解决了资源文件文件问题之后,快速让页面可响应,让用户在体感上更加友好成了最重要的事情,所以启动了一系列关键链路优先、非关键链路渐进式加载的优化项,在做完这些优化之后,性能问题已经基本可以得到解决。那有没有更进一步的优化呢,会在第三部分充分利用缓存-用空间换时间,讲述如何使用缓存把性能优化做到极致的过程。
如何高效打工?本文作者站在开发的视角总结了一些打工技巧,包括如何高效开会、如何与人沟通、如何做PM等,希望可以给大家提供一些帮助。