icon腾讯存算分离数据湖解决方案简介icon
存算分离:TBDS多引擎多集群支持Ozone、COS等存储,存储集群的单独部署,实现存算分离。TBDS集成Alluxio,存储挂载支持TBDS-HDFS、Ozone、COS等,并向上支持Hive、Spark、Presto等计算引擎。计算/存储容器化部署,灵活扩容:利用Ozone分布式对象存储和大数据存储的特性实现存储计算的分离。TBDS计算集群容器化,实现计算资源灵活扩容。TBDS集成Tbase/PG,构建数仓,面向上层数仓建设和数据服务。融合分析、开发工具:TBDS集成SuperSQL,为数据湖(Hadoop)和数仓(MPP)提供统一的SQL中间件,实现融合计算。Wedata工具链为数据湖和数仓提供统一的工具,满足数据入湖、数据分析、数仓构建、数据治理和数据服务等场景。通过数据湖直接为Tione/太极、DataInsight提供数据,满足交互式分析、机器学习、数据挖掘等场景。
icon解决方案的价值icon
icon数据湖的应用场景icon

数据湖应用主要分布于泛互联网(电商、网络广告、社交媒体、游戏、互联网金融等)、泛政务(智慧城市、智慧政府、交通等)、金融(银行、保险等)、工业(工业互联网、能源、制造等)、医疗(基因、影像治疗、诊断等)、汽车(车联网等)以及零售、运营商等其他行业。

icon数据湖的应用场景icon
icon腾讯云数据湖发展历程:十年磨一剑,历经四代演进icon
icon腾讯云对于Apache社区的贡献icon

腾讯主导发布了Hadoop 2.8.4、2.8.5、Spark 2.3.2和Ozone1.0等,也是多个项目的核心贡献者,包括Hadoop 、Spark 、Alluxio、Iceberg、HBase、Hive、MXNet、Parquet等。

icon信创国产化平台icon

腾讯云参与多项工委会信创标准和案例评选工作,作为唯一金融大数据解决方案入选《2020年信息技术应用创新解决方案》。与多家国产服务器、国产芯片和国产操作系统厂商建立合作,并进行适配改造,国产化生态丰富。

icon工信部信息技术应用创新解决方案icon
icon腾讯云数据湖方案优势总结icon
完善的服务支持体系:提供高级现场技术服务+远程技术服务,具备完善的售后服务支撑体系。2小时应急响应,专家现场支持,Apache Hadoop PMC技术专家支持,10多位10+年银行行业数据专家支持,7*24小时热线电话。开放的技术体系:开放生态,保护既有投入资产,全面提升服务交付质量。乐高式组件化设计,可复用行里已有数据产品投资。兼容开源Hadoop,原有Hadoop集群数据,脚本,作业无缝迁移,降低重复开发。学习成本低,市场Apache Hadoop技术人才资源丰富,方便技术人才获取。市场顶级金融行业生态合作伙伴应用开发支持。 完整的知识培训体系:借助知识培训体系,通过“扶上马,送一程”机制帮助客户完成知识转移。现场培训,远程培训,视频课件,论坛沙龙。
icon主要客户icon
icon腾讯云内部数据湖平台应用实践icon
icon腾讯内部云原生数据湖架构示例icon
icon腾讯音乐业务痛点icon

基于Lambda框架搭建的数据处理和分析平台,两套独立实现,维护成本高。业务数据不断变化,业务方每天将业务数据全量导入到数仓中一次,但是频繁导入数仓会造成极大的业务压力,数据应用时延为T+1。同时缺乏高性能的交互式查询引擎,对于海量数据的查询时间在分钟级(分钟-数十分钟),无法对接报表工具进行高效分析。离线链路问题:整体方案是t+1,不能解决时效性问题。Clickhouse 不支持ACID事务,通过外部逻辑保证clickhouse中数据不重复,流程加长。实时链路问题:使用Oceanus ,计算后把指标数据落地到mysql,一旦指标增加和变化,Oceanus应用计算逻辑需要修改。

icon腾讯音乐数据湖解决方案及业务价值icon
数据实时入湖
binlog的流式增量入湖,延时降低到30秒以内
秒级查询、分钟级数据分析
入湖的数据对下游实时可见,下游通过Presto秒级查,端到端的数据分析、展示时间缩短到分钟级
实时应用效果提升
推荐歌曲、引导付费、广告等实时业务推送更加精准、秒级完成
icon腾讯新闻业务痛点icon
海量数据,数据源多元化、数据使用多元化、时效性要求较高、流批兼顾
数据量级庞大
腾讯新闻的文章数据基数庞大,千亿级。腾讯新闻的文章各环节维度众多,多达几百个以上。多维度导致的各个生命周期环节的数据量 线性膨胀,单环多达 日均30-50亿。
数据源类型复杂
全量数据(静态分区表、离线文件),准实时增量,消息流…… 使用场景多样
流式消
批加载 ad-hoc条件检索 准实时update md多维分析
icon腾讯新闻实时数据湖解决方案及业务价值icon
icon成功案例:某国有银行实时数据湖icon

主要目标:实时数据湖取代以hive为主的离线数据湖,统一存储、统一数据查询和服务,该阶段主要关注点:批流融合。

icon某国家传媒数据湖icon
icon某国家传媒湖仓一体icon
icon某电网数据湖整体架构icon
icon某电网建设成果及价值体现icon
链路监控
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
大屏应用
基于微服务开发,实现链路监控,电网总览,供用电总览,指标监测,线损管理,配变运行监测,产业分布,住房空置率。
线损分析
实现分区线损、台区线损、线路线损可视化逐层钻取。 实现台区线损、线路线损逐层钻取、逐层定位,实现线损输入输出异常分析、拓扑关系查看。
数据清洗
按照统一数据模型配置清洗校验规则,清洗结果输出统计和明细数据,异常可追溯。根据异常类型生成对应的工单,形成异常闭环管理。
产品推荐 查看更多>>
    腾讯云云开发CloudBase企业版

    腾讯云云开发CloudBase企业版,仅需专注业务代码,无需关注底层架构和资源弹性。弹性函数计算和数据库,函数瞬间并发可支持万级别以上,提供 10ms 请求响应+100 万 QPS 保障。支撑节点至少跨两个可用区,99.99% 的可用性保障。

    极致的弹性和高并发能力

    极速的研发上线速度

    云原生一体化后端BaaS平台

    支撑节点至少跨两个可用区

    腾讯云数据安全治理中心DSGC

    DSGC从企业数据安全治理、数据安全合规出发,提供云原生数据资产管理、数据分类分级、风险评估等能力;帮助企业解决合规应对、敏感数据排查、数据安全风险检测等多方面的数据安全问题,提高数据安全保障能力, 降低数据安全治理TCO。

    提供云原生数据资产管理

    提高数据安全保障能力

    降低数据安全治理TCO

    帮助企业解决合规应对

    腾讯云会展 易展

    腾讯云会展·易展,营销、撮合、转化,面向展览企业提供的一站式线上平台搭建SaaS工具。帮助主办方快速创建展会内容、现场直播,在线管理招展、招商,帮助传统线下参展企业完成展品数字化上云,帮助展商更得好的跟买家沟通互动,助力展会参展效果提升 。

    一站式线上平台搭建SaaS工具

    帮助主办方快速创建展会内容、现场直播

    帮助传统线下参展企业完成展品数字化上云

    帮助展商更得好的跟买家沟通互动,助力展会参展效果提升