开源生态构建数据湖解决方案
应用场景:
客户基于Hadoop生态构建数据处理与分析
广泛使用在互联网、金融、制造业、交通等各领域
用户痛点:
数据规模增长快,存储资源与计算资源扩容速度不匹配,客户有成本优化需求
数据来源广,存储系统需要对接不同的数据源,包括应用数据
为什么选择阿里云?
OSS能支撑 EB 规模的数据湖,支持多种数据通道,全面覆盖日志、消息、数据库、HDFS 各种数据源
OSS 无缝对接EMR Hive、Spark、Presto、Impala 等大数据处理引擎,消除数据孤岛
阿里云 EMR 大数据专家级服务支持
阿里云 Data Lake Formation 提供数据湖元数据管理、数据湖加速等服务;EMR大数据专家级服务支持