• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
    OPEN API
logo Online Tools
All Chinese English Newest Hottest
6265 search results

RTP 系统(即 Rank Service),是一个面向搜索和推荐的 ranking 需求,支持多种模型的在线 inference 服务。在过去的几年里,我们对于RTP业务的GPU性能优化已经做了不少尝试,包括kernel fusion,CUDA Graph等。在此基础上,今年我们又在RTP上集成了Multi Stream[01],改变了TensorFlow的单流机制,让多流的执行并行,作为增加GPU并行度的另一种选择。 RTP执行的backend是TensorFlow。TensorFlow作为调度算子的框架应用在推荐业务的推理场景中,对GPU是比较不友好的。这是因为TensorFlow总是倾向于用大量的operator构建一个graph,每个operator在GPU上又会调用一个或者多个kernel;而同时,TensorFlow本身是一个单流模型,在一个进程内只有一个Stream group(包含一个Compute Stream,一个H2D Stream,一个D2H Stream和一个D2D Stream),kernel间的执行很难并行,可以说调度的效率是偏低的。

184 Technology lddgo Shared on 2023-12-01

随着ChatGPT的讨论度愈来愈高,一些爱好者也从中做了许多新的尝试,例如从中构建小的产品闭环,又或者提升自己的工作效率。我自己和两位小伙伴也实操了一个绘本案例,分享给大家,希望大家能从实践中对AIGC有更深的感触和了解~

221 Technology lddgo Shared on 2023-12-01

有了多集群服务和跨集群的流量调度之后,使用 Kubernetes 的方式会发生很大的变化。流量的管理不再限制单一集群内,而是横向跨越了多个集群。最重要的是这一切“静悄悄地”发生,对应用来说毫无感知。 就拿 Kubernetes 版本升级来说吧。记得曾经经历过集群的原地升级:团队的几个人经过多次、多个环境的演练,还要在凌晨的时候进行生产环境的升级。幸好最后是有惊无险,整个过程的体验就像是下图一样:为飞行中的飞机换引擎。

331 Technology lddgo Shared on 2023-12-01

2023 年H1,B 站集中出现了多个因变更导致的应急事件。从Google SRE和行业的分享经验我们知道 70%的此类事件是由变更导致的。 需要认识到,历史上任何技术债务都不会自行消失。如果我们不加以治理,这些问题将在某个不经意的时候爆发,届时我们将不得不付出数倍的代价。 H1 的几个变更风险,未能被及时扼杀在摇篮中,以至于发布到线上环境才发现问题,甚至还需要较长时间才得以恢复。我们深入分析了几个典型情况:

284 Technology lddgo Shared on 2023-12-01

终端工程方向的兴起十年有余,从最初的各种工具库、框架争相斗艳百舸争流,到 React、VUE 二分天下家族兴旺;从 HTML、CSS、JS 三兄弟 苦苦挣扎,到 Node.js、Typescript、WASM 等横空出世。从 Web、 APP 各自为战,到小程序、Flutter 等混合研发方案杀出重围。终端技术的每一次飞跃都离不开工程能力和研发模式鼎力相助。本话题旨在提升研发效率和质量的创新型技术方法和实践,涵盖:低(无)代码、智能辅助研发、构建工具、编码调试插件和方法、监控和性能度量、自动化测试和发布流程等。

222 Technology lddgo Shared on 2023-12-01

本专题共10篇内容,包含淘宝APP基础链路过去一年在用户体验数据科学领域(包括商详、物流、性能、消息、客服、旅程等)一些探索和实践经验。 在商详页基于用户动线和VOC挖掘用户决策因子带来浏览体验提升;在物流侧洞察用户求助时间与实际物流停滞时长的关系制订表达策略带来物流产品满意度提升;在性能优化域构建主客观关联模型找到启动时长与负向反馈指标的魔法数字以明确优化目标;构建多源VOC标签体系综合运用用户行为和用户VOC洞察、落地体验优化策略,并总结出一套用户体验分析方法论。

234 Technology lddgo Shared on 2023-12-01

RocketMQ5 PopAck源码拆解

262 Technology lddgo Shared on 2023-12-01

什么是编程语言? 简单直白来说,编程语言是被标准化的,用来向计算机发出指令,让程序员利用计算机能力的工具。 从计算机被发明至今的几十年里,出现过很多编程语言,下面让我们从时间维度入手来聊聊一些流行的、具有历史影响力的编程语言。这一系列图主要按时间从上往下排序,依据类型和指导思想进行聚类,根据互相的影响使用线条指向,并补充了一些关键性的特征和评价。 严谨起见,本文提到的“编程语言”指的是“第三代高级编程语言”。

259 Technology lddgo Shared on 2023-12-01

腾讯混元大模型 API 产品,可以实现对话沟通、内容生成、分析理解,可以广泛应用在智能客服、智能营销、角色扮演、广告文案创作、商品描述、剧本创作、简历生成、文章写作、代码生成、数据分析、内容分析等各类场景。本文目标将结合腾讯混元大模型实现,表设计,数据库连接,代码增删查改的实现等功能。

323 Technology lddgo Shared on 2023-11-30

阿里商旅作为飞猪旅行旗下面向企业客户的数字化差旅解决方案产品,依托飞猪旅行机票、酒店供应链为企业客户提供一站式的机票、酒店、火车票、用车等预订管控及结算票据服务。阿里商旅不仅是集团欢行的供应商,而且近几年在商业化差旅市场上崭露头角,服务了2万+中大型客户,43万+小微企业。

244 Technology lddgo Shared on 2023-11-30