Databricks数据洞察包含了完整的社区版Spark的功能和特性,全面兼容Apache Spark。 Databricks数据洞察包含以下组件:
Databricks数据洞察构建在ECS之上,使用阿里云对象存储服务(OSS)为核心存储。本文介绍Databricks数据洞察的产品架构。 存储访问加速层方便您可以像操作HDFS上的数据一样访问OSS上的数据。 目前,Databricks数据洞察提供了两种执行Spark作业的方式,包括通过Notebook或者在项目空间里新建Spark作业。同时,Databricks数据洞察还提供了监控告警、元数据管理、权限管理等功能,方便您对集群资源进行管理。
统一的大数据管理平台,从上游数据抽取到下游数据分析,贯穿整个数据分析工作流。自动扩缩容,免运维,降低运维成本。
简化机器学习生命周期,快速进行模型测试、实验、以及生产部署,并可视化结果。