提供对流式数据的采集、存储、分发功能。用户可以基于DataHub轻松构建基于流式数据的分析和应用。【数据采集】:提供SDK、插件、兼容Kafka Producer协议,帮助您采集各类业务数据。【数据存储】:采用存储计算分离架构,计算避免数据热点,存储使用自研盘古系统,具备高安全、多副。本、强稳定的特点,SLA达99.99%【数据投递】:支持涵盖几乎所有阿里云计算引擎,系统无缝对接,连接性好。
负责用户的接入,同时会对Data进行格式化,然后传给Xstream。与pangu的存储集群交互,读写数据, 同时有Metric采集,资源回收等模块。负责将DataHub中的数据同步到其他产品,处理订阅的创建删除,协同消费以及订阅点位的保存和获取。所有模块均运行在Fuxi集群中,以Fuxi Service形式进行管理。系统采用存储计算分离架构,数据均存储与Pangu集群中,不依赖本地磁盘。
数据采集:提供多种SDK、API和第三方插件以及Kafka协议,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,进行统一管理,消除数据孤岛。
数据存储:灵活设置存储时间,保证下游系统可重新消费数据,自身自动提供数据多备份和存储加密,具备跨机房容灾功能,安全可靠。
数据投递:提供DataConnector模块,简单配置即可把接入的数据实时同步到下游系统(如MaxCompute、OSS、TableStore等主流系统)极大减轻了数据链路的工作量,实现一投多消。