文库

文库
字符
转换
加密
网络
更多

图表

数学

坐标

图片

文件
文库

字符

转换

加密

网络

更多

图表

数学

坐标

图片

文件

在线工具大全

所有

中文

英语

最新

热度

3418 条查询结果投稿

【229秒 -> 69秒】部署时间缩短69%，ICBU商家技术部应用部署治理实践

部署时长不仅影响线上问题的解决恢复能力，也严重影响了我们日常的开发效率。本文记录了作者部署时的一些提效手段和最终的效果。

阿里巴巴技术

5 技术 lddgo 分享于 2024-05-15

干货｜火山引擎A/B测试平台如何“嵌入”技术研发流程

字节跳动内部有着非常浓厚的数据文化和实验文化，数据中台已经成为研发流程中的新基建，A/B测试也基本上是整个研发链路上的必经一环。那么如何将数据驱动有效应用在研发体系中呢？本文基于字节的多年实践从“研发流程中无处不在的数据驱动”、“如何建立可持续的数据驱动文化”、“数据驱动的ROI”三个方面，剖析构建数据驱动的新型研发体系，充分展现A/B测试如何“嵌入”技术研发的流程及其效果。

字节跳动技术

4 技术 lddgo 分享于 2024-05-15

Kubernetes Gateway API v1.1 解读

几天前，K8s Network SIG 发布了 Gateway API（简称 gwapi）的 v1.1 版本[1]，这个版本的发布包含了多项重要功能的 GA（一般可用），以及一些实验功能的引入。这两部分分别通过标准渠道和实验渠道发布。

kubernetes

2 技术 lddgo 分享于 2024-05-15

最后走的人关灯，人类的任务是迎接智能机器的来临吗？

腾讯技术

3 技术 lddgo 分享于 2024-05-15

百度百舸 AIAK-LLM 的大模型训练和推理加速实践

本文整理自 4 月 16 日的 2024 百度 Create 大会的公开课分享《百舸 AIAK-LLM：大模型训练和推理加速实践》。今天要分享的主题是 AI Infra 相关的内容，主要内容分为四部分。首先和大家一起讨论大模型给基础设施带来的挑战。第二部分则是向大家介绍一个大模型训练和推理过程中的关键性能指标 MFU，以及为了提升这个 MFU 业界已经做的一些技术和手段。第三部分则是从百度百舸 AIAK-LLM 实际落地过程中遇到的一些问题出发，通过解决这些问题我们将大模型训练和推理的 MFU 提升到了一个非常好的状态。最后一部分则是从产品维度简单介绍下相关能力和理念。

百度技术

1 技术 lddgo 分享于 2024-05-15

混元文生图大模型正式开源：15 亿参数、首个中文原生DiT架构、与腾讯现网版本完全一致！

1 Sora 同源的 DiT 架构 2 中文原生的理解能力提升 3 全面开放，与现网版本完全一致

腾讯技术

1 技术 lddgo 分享于 2024-05-15

震撼科技界的GPT-4o发布首日即遭“越狱破防”

【大模型安全初探】是由腾讯朱雀实验室推出的，针对大模型AI安全前沿风险的系列研究。本文主要解读分析OpenAI最新推出的大型模型GPT-4o可能存在的越狱风险。

5 技术 lddgo 分享于 2024-05-15

电商AI数字人直播体验设计

随着以ChatGPT、文心一言为代表的大语言模型相继涌现，AI+电商也带来新的购物体验和新的经营模式。「电商AI数字人直播解决方案-慧播星」依托自研StyleSync技术/音频自恢复预训练技术/文心一言/自研PicGen技术等，实现AI复刻/定制优质主播、稳定7*24小时在线开播。低成本搭建多元直播场景，专家级商品讲解、实时互动问答、丰富的互动形态精准传达信息，既让消费者获得全新的购物体验，也赋能中小商家零门槛、零成本一键创建商品售卖直播间、助推GMV增量，减少生产成本，实现消费体验和生产效能的“双提升”。

百度技术

2 技术 lddgo 分享于 2024-05-15

KubeAI大模型推理加速实践｜得物技术

最近我们在生产环境批量部署了大模型专用推理集群，并成功让包括70B在内的大模型推理速度提升50%，大幅缩减部署成本，稳定应用于生产环境。本文基于我们在部署大模型推理集群时的一些经验，分享一些有效提升大模型的推理速度方法。最后，我们在结尾处推荐了几个经过我们评测且表现优异的大模型推理框架。希望这些建议能帮助读者在项目中选择适合自己的推理框架。 OpenAI的科学家Hyung Won Chung在2023年的公开演讲《Large Language Models》[8]中指出，大模型的某些能力仅在达到特定规模时才能显现，可见未来大模型的参数量肯定会越来越大，这也是大模型的发展趋势。随着参数量的增加，对大模型的推理速度要求越来越高，有哪些方法可以提高大模型的推理速度或吞吐量？首先我们将探讨大模型的加速优化方向，随后文章将依据时间线，介绍一些业界内较为经典的实用大模型加速技术，包括但不限于“FlashAttention[1]”和“PageAttention[3]”等技术。以下为按时间顺序业界的一些经典大模型推理加速技术，本文试图为读者提供一个按时间发展顺序的大模型加速方法综述。

得物技术

1 技术 lddgo 分享于 2024-05-15

神经网络详解：以最易懂最清晰的方式讲解神经网络

神经网络是一门重要的机器学习技术。它是目前最为火热的研究方向--深度学习的基础。学习神经网络不仅可以让你掌握一门强大的机器学习方法，同时也可以更好地帮助你理解深度学习技术。　　本文以一种简单的，循序的方式讲解神经网络。适合对神经网络了解不多的同学。本文对阅读没有一定的前提要求，但是懂一些机器学习基础会更好地帮助理解本文。　　神经网络是一种模拟人脑的神经网络以期能够实现类人工智能的机器学习技术。人脑中的神经网络是一个非常复杂的组织。成人的大脑中估计有1000亿个神经元之多。

1 技术 lddgo 分享于 2024-05-15

简体中文