作为企业数字化建设的必备要素,易用的数据引擎能帮助企业提升数据使用效率,更好提升数据应用价值,夯实数字化建设基础。 数据导入是衡量OLAP引擎性能及易用性的重要标准之一,高效的数据导入能力能够加速数据实时处理和分析的效率。作为一款OLAP引擎,火山引擎云原生数据仓库ByteHouse源于开源ClickHouse,在字节跳动多年打磨下,提供更丰富的能力和更强性能,能为用户带来极速分析体验,支撑实时数据分析和海量离线数据分析,具备便捷的弹性扩缩容能力,极致的分析性能和丰富的企业级特性。 随着ByteHouse内外部用户规模不断扩大, 越来越多用户对数据导入提出更高的要求,这也为ByteHouse的数据导入能力带来了更大的挑战。 本篇文章来源于ByteHouse产品专家在火山引擎数智平台(VeDI)主办的“数智化转型背景下的火山引擎大数据技术揭秘”线下Meeup的演讲,将从ByteHouse数据库架构演进、增强HaKafka引擎实现方案、增强Materialzed MySQL实现方案、案例实践和未来展望四个部分展开分享。
本文就如何利用火山引擎云数据库 PostgreSQL 版和大语言模型技术(Large Language Model,简称 LLM),实现企业级智能交互式问答系统进行介绍。通过本文,你将会了解交互式问答系统的原理,学习 PostgreSQL 的向量化存储和检索技术,以及大语言模型交互技术等。
“跑个 A/B 试试?” 在字节跳动,你可能经常会听到这句话。 看上去让人摸不着头脑,但实际上,这是字节跳动的一种神奇的决策机制 —— A/B 测试,让我们借助大数据的手段,从多种不同的方案中,选出最合适的一个,充满了数据科学的魅力。
根据 Datadog发布的“2023年Serverless状态报告”, Serverless 使用量的大幅增长,已经成为主流。 Serverless和云原生数据库的结合可以提供更高效、可扩展、灵活和安全的数据处理和分析解决方案,帮助企业更好地利用云资源,提高数据处理和分析的性能和效率。 本篇将通过“五问ByteHouse”,为你解读云原生数据库如何拥抱Serverless。
Monorepo 是一种项目代码管理方式,指单个仓库中管理多个项目,有助于简化代码共享、版本控制、构建和部署等方面的复杂性,并提供更好的可重用性和协作性。
《跟着德爷闯东非》是Pico一款全新的6DoF互动纪录片。主角由在全球拥有530万粉丝的明星探险家德爷(Edward James Stafford)担任。观众以第一视角摄影师的身份陪伴德爷一起冒险,近距离观察野生动物,体验非洲大草原的野外生存之旅。
谈到数据仓库, 一定离不开使用Extract-Transform-Load (ETL)或 Extract-Load-Transform (ELT)。将来源不同、格式各异的数据提取到数据仓库中,并进行处理加工。传统的数据转换过程一般采用Extract-Transform-Load (ETL)来将业务数据转换为适合数仓的数据模型,然而,这依赖于独立于数仓外的ETL系统,因而维护成本较高。 ByConity 作为云原生数据仓库,从0.2.0版本开始逐步支持 Extract-Load-Transform (ELT),使用户免于维护多套异构数据系统。本文将介绍 ByConity 在ELT方面的能力规划,实现原理和使用方式等。
标签作为企业数字化营销的基石,在企业运营与营销场景下发挥着重要的作用,通过标签体系,企业可以更好地了解消费者的需求和行为,丰富用户画像特征,帮助企业优化产品设计和营销策略,提高产品的市场竞争力。 因此,企业需要从业务场景出发,构建适用于自身业务模式和逻辑的标签体系,为企业的精细化运营及精准营销服务,进而深入挖掘潜在的商业价值。 本次分享来源于火山引擎客户数据平台VeCDP服务于近百个场景的经验,将汽车、金融、零售、泛互等领域交付、落地经验抽象成5000字干货,从方法论到案例,帮你建设一套“好的”标签体系。