数栖EMR(Elastic MapReduce,简称EMR)是数澜科技自研的一站式企业级大数据处理系统,完全兼容开源生态,为客户提供高性能、低成本、灵活易用的全栈大数据平台。依托开源的Apache Hadoop、Spark、 Hive、 Flink等技术,向客户提供高可靠、安全、易用的集群管理能力,还支持大规模集群的监控、告警、权限管理等功能。在数栖EMR上层,可采用数栖平台或者第三方大数据开发套件来进行数据研发工作。
利用数栖EMR中的Hadoop、Hive、Spark等服务和底层数据存储方案,可以完成用户海量数据的批处理任务,实现数据分析、生成商业报表等业务需求。
Spark安装包中内置血缘解析插件,可解析出字段级别的血缘关系。