用户可快速创建使用Hadoop集群。通过Web集群管理系统,可轻松实现对集群资源和集群用户的管理,以及对集群服务的管理、监控与运维,让工程师更专注于商业价值应用的开发与优化。
集群环境深度优化,集群数据安全稳定。采用LDAP、Kerberos、Ranger一套完整的技术体系,实现完备的安全管控与审计。
用户可按需申请集群资源,及时且资源最优化满足各类上层应用的计算或存储需求。
全面兼容开源大数据标准和生态,适配移动云中间件、数据库、大数据领域相关产品。
一键式集群安装部署和扩容,用户无需关注硬件的购买和维护
支持数据冗余存储、集群所有服务管理节点支持HA高可靠,实现集群高可靠性
支持集群内计算资源按租户维度隔离,实现企业级大数据多租户能力
支持LDAP,Kerberos,Ranger 实现完整的集群认证鉴权管理
海量数据分析是现代大数据系统中的主要场景。通常企业会包含多种数据源,接入后需要对数据进行ETL处理形成模型化数据,以便提供给各个业务模块进行分析梳理。
数据量巨大
对执行实时性要求不高,作业执行时间在数十分钟到小时级别
数据来源和格式多种多样
实时分析场景往往具备数据生产快、实时性强、数据量大的特点,这便导致离线数据分析架构无法满足数据时效性需求。Flink/Spark等流计算引擎的出现,可以根据业务需求对数据进行计算分析,最终把结果保存或者分发给需要的组件或业务系统。
海量数据吞吐
实时数据更新,低时延
兼容开源Kafka/Pulsar 等数据中转技术