icon企业的数据治理工作开展了很多年,依然成效有限icon
数据治理咨询成果落地不足
数据治理咨询成果,比如各类规范、模型和管理办法等,多以”纸面文件”的形式在企业中流转,与实际业务和数据没有很好的关联、约束,导致难以落地
数据治理工具能力不足
缺少灵活、高效的数据治理在线管理工具来支持数据治理工作的执行,“数据的描述”和“数据的记录”两张皮,且数据的描述信息不完备,导致数据治理分析陷于“被动”局面,无从下手
自动化服务程度不高
业务人员使用数据更多需要专业数据开发工程师的贴身服务,数据使用效率低。数据治理人员需要依赖自身经验来手工分析问题、发现问题和优化问题,数据治理工作成为“脏活累活”
数据治理成效可视度低
缺少以量化方式来评估数据治理成熟度水平,数据治理工作推动的成效不易衡量,数据治理人员或团队不易说清价值产出,导致数据治理工作不易持续开展,成为“运动式”数据治理
iconDataWorks 产品架构图icon
iconDataWorks 产品核心优势 阿里巴巴大数据建设最佳实践与方法论的10+年结晶icon
功能健全
一站式全域数据平台 性能卓越
覆盖数据研发全生命周期;日PB级数据同步;日千万级任务调度;
简单易用
全图形化操作界面 低代码开发
1小时上手;大数据全流程研发;阿里数千名运营小二都在用;
降本增效
云原生、全托管 开箱即用
相比自研或使用开源工具,有效降低平台研发和运维成本,让您专注于业务本身;
安全稳定
租户隔离 细粒度权限控制
金融级数据安全保障;通过“双11”稳定性考验;
iconDataWorks 认证及荣誉奖项icon
icon数仓建设从“精益生产”到“敏捷制造”icon

从“小步快跑,快速满足需求为先”到“规范化,可持续发展”的数仓建设理念转变

iconDataWorks 智能数据建模icon

智能数据建模是DataWorks基于阿里数据中台方法论和Kimball维度建模理论自研的数据建模产品,与DataWorks数据开发体系无缝衔接

产品优势
支持从业务抽象到数仓顶层规划
支持设置模型设计空间,不同部门可共享一套数据标准和数据模型
与数据质量无缝打通,根据数据标准自动生成质量规则,落标检查不再难
支持逆向建模,解决现有数仓的建模冷启动难题
支持通过Excel文件导入模型和通过FML(一种类SQL的DSL)快速构建模型
支持与数据开发DataStudio无缝打通,自动生成ETL代码
与维度建模无缝打通,可根据原子指标和不同维度批量创建派生指标
iconDataWorks 数据集成解决的问题icon
线下数据快速整库搬站上云
把云下数据快速安全的迁移到云上存储并做进一步的业务分析,如线下MySQL、Oracle到云上MaxCompute,传统数仓迁移上云,一次性全量和持续增量数据同步
流式数据汇聚
批流数据汇聚 IoT数据汇总分析
各种Log数据流收集
云上各个产品之间数据同步
从AWS、GCP到阿里云,阿里云内部RDS、 MaxCompute、OSS、PolarDB、AnalyticDB、Datahub等之间的数据同步
数据仓库容灾备份 冷热数据分离
数据需要转移到其他存储系统,做容灾或者长期备份,MaxCompute数仓上的冷数据同步到OSS,并压缩以节省存储空间
iconDataWorks 数据集成 - 数据上下云的枢纽icon

支持50+关系型数据库、非结构化存储、大数据存储、消息队列之间的数据同步

iconDataWorks 数据集成实时同步核心能力icon
iconDataWorks 全链路数据开发平台icon
iconDataWorks 数据开发(Data Studio)icon

Data Studio支持阿里云MaxCompute、Hologres、E-MapReduce、CDH、AnalyticDB、Clickhouse等多种计算存储引擎的数仓开发,可构建复杂的业务流程和调度依赖,提供开发、生产环境隔离的研发模式

业务流程混合编排
可视化拖拽式多引擎任务混合编排
智能SQL编辑器
AI加持的SQL编辑器,智能提示,SQL算子结构可视化展示,智能SQL诊断
全面的引擎能力封装
支持计算引擎的任务、表、资源、函数管理,让您无需接触复杂的引擎命令行
自定义节点
提供自定义节点插件化机制,支持您扩展计算任务类型,自主接入自定义计算服务
iconDataWorks 数据分析icon

DataWorks数据分析可以便捷的连接各类数据源,提供电子表格、SQL查询、SQLNotes等多种数据分析能力,适用于数据分析师、业务运营等人员日常工作取数、查数和报表分析等需求场景。

电子表格
支持本地数据上传与在线数据源,兼容大总分Excel函数计算,支持透视分析和数据探查。
SQL查询
支持多种数据源,更便捷更轻量的SQL查询取数工具。
SQLNotes
提供SQL Notebook交互形式,支持以文档的形式记录数据分析的过程,包含分析思路、SQL以及数据结果,并提供数据可视化展示。
数据上传
提供快捷的数据编辑上传至MaxCompute的功能,特别适用于小数据量的表格编辑上传。
iconDataWorks 任务调度系统icon

日千万级超大规模周期性任务调度系统,久经阿里巴巴“双11”考验,性能与稳定性业界领先

DataWorks调度系统核心能力
• 跨多种计算引擎的可视化任务流程编排
• 分钟/小时/天/周/月/年周期调度
• 顺序/循环/分支判断流程控制
• 跨地域/跨周期任务依赖
• 任务节点上下文传参
• 依赖成环与孤立节点自动检测
• 触发式调度
iconDataWorks 任务运维中心icon

提供图形化任务运维管理,支持千万级任务依赖图(DAG)逐级展现,一个人就可以管理和运维成百上千个任务,极大降低了运维成本

实时任务运维
• 实时同步任务管理 • 流计算任务管理
触发式任务运维
• 手动任务管理 • 手动实例管理
周期性任务运维
• 周期任务管理 • 周期实例管理
• 补数据实例管理 • 测试实例管理
移动运维
• 提供钉钉小程序
• 支持常用任务运维操作
• 方便出差/夜间随手运维任务
icon企业数据治理的挑战icon

实现数据治理的“问题发现-问题治理-治理评估”,让企业数据治理步入“自动化”阶段

iconDataWorks 数据治理核心能力:数据治理中心icon

DataWorks数据治理中心针对多个治理领域,围绕数据研发全链路,进行综合治理健康分评估,推动治理工作。系统通过数据领域规则沉淀,自动识别资产待优化问题项,提供覆盖事后及事前的治理优化策略方案,帮助用户主动式、体系化完成数据治理工作。

iconDataWorks 数据治理核心能力:元数据管理(数据地图)icon

数据资产的有序组织,快速查找数据、理解数据和使用数据,助力数据的便捷消费

iconDataWorks 数据治理核心能力:智能监控管理icon

一键实现工作流的全链路监控告警配置,解决复杂工作流告警无从配置的难题

iconDataWorks 数据治理核心能力:数据质量管理icon

DataWorks数据质量(Data Quality Center)针对数据开发全链路,保障数据可用性。通过对数据质量规则的高效执行校验,以及和任务调度流程的紧密结合,能帮助用户第一时间发现质量问题、有效防止数据质量问题扩散。为业务提供高效、可靠、可信赖的数据

iconDataWorks 数据治理核心能力:数据安全管理icon

提供完善的细粒度数据权限控制,数据分类分级、敏感数据发现与脱敏、风险识别、预警与审计等数据安全能力

iconDataWorks 数据服务核心能力:低代码构建数据APIicon

通过数据服务,用户能够将数据表快速生成数据API,或将已有API快速注册至本平台进行统一管理与发布。数据服务还支持编写函数对API进行加工处理;支持将若干API与函数可视化编排为工作流程,零代码实现API的串、并行调用

iconDataWorks 数据服务解决从数仓到应用的“最后一公里”icon
iconDataWorks迁移助手与迁云专家服务icon

DataWorks迁移助手支持将开源调度引擎的作业迁移至DataWorks;DataWorks作业跨云、跨Region、跨账号迁移;DataWorks作业快速克隆部署;同时提供迁云专家服务。

iconDataWorks 开放平台icon

DataWorks开放平台提供了丰富的OpenAPI、OpenEvent以及插件化能力(扩展点及扩展程序),允许用户自有系统与DataWorks进行深度对接,以及对DataWorks的处理流程进行自定义。

icon离线实时一体化数据仓库解决方案icon
架构清晰
离线实时一体化数仓
最简单大数据分析架构
性能强大
EB级离线计算
PB级数据亚秒级分析
成本下降
TCO下降30%
icon数据湖分析解决方案icon
数据整合
多源数据整合,数据可靠性达
99.9999999999%
弹性伸缩
存储与计算分离
计算弹性伸缩自定义
加速分析
JindoFS加速文件系统
高效读取OSS数据
icon智能推荐解决方案icon
效果提升
平均模型准确率提升2个点
场景通用
电商/资讯/广告/互娱/直播/社交/音视频等所有互联网推荐业务相关场景
开箱即用
支持全托管/半托管 免运维/轻运维
降本提效
模型训练,模型服务弹性伸缩速度提升
iconDataWorks 产品在线体验icon

阿里云大数据和AI体验馆提供了沉浸式大数据及AI案例体验,通过Step-by-Step的实操引导,带您快速体验DataWorks产品及飞天大数据平台中的其他产品

产品推荐 查看更多>>
    DataPipeline批流一体数据融合平台

    DataPipeline批流一体数据融合平台采用基于日志的增量数据获取技术(Log-based change data capture),为主数据管理、数据仓库、大数据平台提供实时、准确的数据变化,从而使得客户可以根据最新数据进行运营管理与决策制定。

    无代码、配置式数据管道

    分布式引擎、组件级高

    实时数据管理

    增量数据获取技术

    中科智云X-Brain交通数字化治理AIoT解决方案

    X-Brain是企业数字化治理AIoT平台的核心产品,功能包括智能数据管理、模型算法管理、支持算法零代码开发,能快速构建面向场景的算法,用少量样本、自动标注、快速训练构建应用算法模型,搭建应用平台。面向企业流程无人化、监控无人化,设备操作无人化,设备检测无人的人工智能平台。

    数据采集

    快速定制

    开放兼容

    降低成本

    阿里云 虚拟数字人

    淘宝天猫平台商家可以在淘宝直播平台上,通过“品牌智能直播间”所提供的虚拟数字人主播和虚拟人直播运营平台实现在其店铺直播间,让虚拟人电商主播像真人电商主播一样,进行商品介绍售卖以及和观众进行互动。直播间观众在观看直播的过程中会看到由虚拟数字人主导进行的直播内容,并可以与虚拟人主播进行互动。

    打造专属的智能直播间,一键开播

    剧本智能构建

    丰富的人物及背景、效果插件可选配置

    多模态智能交互