• ARTICLE
  • STRING
  • CONVERTER
  • ENCRYPT
  • NETWORK
  • MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
  • ARTICLE
    STRING
    CONVERTER
    ENCRYPT
    NETWORK
    MORE
    CHART
    MATH
    COORDINATE
    IMAGE
    FILE
logo Online Tools
All Chinese English Newest Hottest
425 search results

Apache Iceberg 是一种开源数据LakeHouse表格式,提供强大的功能和开放的生态系统,如:Time travel,ACID事务,partition evolution,schema evolution等功能。 本文将讨论火山引擎EMR团队针对Iceberg组件的优化思路,通过引入索引来提高查询性能。

50 Technology lddgo Shared on 2023-08-02

教你如何构建自己的依赖注入工具

45 Technology lddgo Shared on 2023-08-02

近期,字节跳动宣布开源面向叙事的智能可视化解决方案——VisActor。VisActor来源于字节跳动海量场景实践,能在可视化完整流程的各个关键节点提供支持,包括可视化图形渲染引擎、可视化语法、图表、高性能多维分析表格等多个组件能力。

52 Technology lddgo Shared on 2023-08-01

ByConity适合多种业务场景,在实时数据接入、大宽表聚合查询、海量数据下复杂分析计算、多表关联查询场景下有非常好的性能。 本文将用一个实际的业务场景来介绍这套行为分析系统,ByConity是基于用户的多维度行为分析平台,提供事件分析、留存分析、转化分析、用户分群、用户留存等多种分析方式和场景。

39 Technology lddgo Shared on 2023-07-28

预聚合是OLAP系统中常用的一种优化手段,在通过在加载数据时就进行部分聚合计算,生成聚合后的中间表或视图,从而在查询时直接使用这些预先计算好的聚合结果,提高查询性能,实现这种预聚合方法大多都使用物化视图来实现。 ClickHouse社区实现的Projection功能类似于物化视图,原始的概念来源于Vertica,在原始表数据加载时,根据聚合SQL定义的表达式,计算写入数据的聚合数据与原始数据同步写入存储。在数据查询的过程中,如果查询 SQL 通过匹配分析可以通过聚合数据计算得到,直接查询聚合数据减少计算开销,大幅提升查询性能。

198 Technology lddgo Shared on 2023-07-28

企业在进行营销推广时,广告投放通常是必备环节之一。为了避免投放“乱烧钱”,在大规模投放前,企业和广告优化师都会希望在多种广告策略中,找准效果更好策略才进行投放。早期这样的方案决策只能通过“拍脑袋”,或者简易的分流投放测试来粗略进行。在火山引擎AB测试推出“广告投放AB实验”后,可逐步支撑企业快速、科学地验证不同投放策略的平均转化成本数据效果,并根据实验报告得到计划中不同素材、不同落地页、不同人群包、不同预算等变量到底哪种更好。 广告投放AB实验背后,所需的数据能力支撑繁琐而复杂,开启广告实验后,如果数据不能够及时准确的送达,会对报告结论造成影响,甚至影响最终决策,而这均依赖于AB实验平台底层的基础投放能力。

35 Technology lddgo Shared on 2023-07-27

预聚合是OLAP系统中常用的一种优化手段,在通过在加载数据时就进行部分聚合计算,生成聚合后的中间表或视图,从而在查询时直接使用这些预先计算好的聚合结果,提高查询性能。 实现这种预聚合方法大多都使用物化视图来实现,本文将为大家分享火山引擎ByteHouse基于ClickHouse物化视图的进阶Projection实现。

48 Technology lddgo Shared on 2023-07-26

Chrome 浏览器运行原理你了解多少?

41 Technology lddgo Shared on 2023-07-26

在 7 月 21 日至 22 日举行的 ArchSummit 全球架构师峰会(深圳站)及 DataFunCon.数据智能创新与实践大会(北京站)上,来自火山引擎 DataLeap 的三位专家分别就 DataOps、数据治理和指标体系等方向进行了精彩的分享。 本次分享内容皆来自于字节跳动业务实战经验,希望可以帮助企业更高效地管理和处理大量的数据,提高数据资产的价值和利用率,助力企业抓稳数字化机遇,建立数据驱动的决策机制。 以下为嘉宾演讲PPT部分精彩内容,关注字节跳动数据平台微信公众号回复【0721】,或点击文末“阅读原文”,即可下载完整版PPT。

41 Technology lddgo Shared on 2023-07-25

本文为 Apache Hudi 技术社区分享会第十期嘉宾分享文章,主要介绍火山引擎 LAS 团队自研的多场景样本离线存储技术,用于处理机器学习系统的离线数据流。同时,还会为大家揭秘流批一体样本生成的过程,分享对 Hudi 内核所做出的优化和改造,探索其在数据处理领域的实际应用和效果。

49 Technology lddgo Shared on 2023-07-20