HCIP-BigData课程不仅深入大数据高级技术,实操华为FusionInsight等平台,培育大数据分析与解决方案开发专业技能,还包括了更广泛的知识点。学习内容扩展到大数据应用开发总指导、主流技术、场景化解决方案及应用开发流程等关键知识领域,为学员提供全面的大数据技术与应用视野。
课程内容涵盖了大数据的主流技术栈,包括但不限于分布式文件系统HDFS、NoSQL数据库HBase、数据仓库工具Hive、资源协调平台YARN/MapReduce、任务调度器Oozie、全文检索服务器Solr、分布式发布订阅消息系统Kafka、以及基于内存的计算框架Spark等。这些技术支撑了大数据的存储、处理、分析和挖掘等各个环节。
HCIA-Big Data
HCIP-Big Data
HCIE-Big Data
内容1
大数据发展趋势与鲲鹏大数据HDFS 分布式文件系统原理
内容2
ZooKeeper 分布式协调服务HBase 分布式数据库技术
内容3
Hive 分布式数据仓库技术
内容4
ClickHouse 联机分析数据库管理系统MapReduce 与 Yarn 技术原理
内容5
Spark 基于内存的分布式计算
内容6
Flink 流批一体分布式实时处理引擎Flume 海量日志聚合技术
内容7
Kafka 分布式消息订阅系统ElasticSearch 分布式全文检索服务
内容8
华为大数据平台 MRS数据治理中心 DataArtsStudio
内容1
1、大数据主流技术2、大数据场景化解决方案3、大数据应用开发
内容2
1、Java 开发环境配置2、Maven 环境配置3、开发工具介绍、集成maven4、Java 基础语法、对象和类5、Java 循环结构、Java 条件语句6、Java 集合List,Set,Map
内容3
1、离线批处理方案2、离线批处理组件的介绍、技术原理、参数属性、重要配置等,包括数据存储 HDFS
内容4
1、Java 连接操作 HDFS2、数据仓库 Hive3、java 连接操作 Hive
内容5
1、离线批处理方案2、离线批处理组件的介绍、技术原理、参数属性、重要配置等,包括数据存储 HDFS,数据仓库Hive
内容6
1、离线分析 SparkSQL2、数据集成工具 Loader、Sqoop、Kettle 等3、离线批处理实际案例
内容7
1、实时检索场景方案2、分布式数据库介绍、技术原理、参数属性、重要配置等,包括 Hbase、ElasticSearch、GraphBase 等3、实时检索实际案例
内容8
1、实时流计算应用方案2、实时流计算组件的介绍、技术原理、参数属性、重要配置等,包括Flume、Kafka、Flink、SparkStre 上午 ing、Redis 等
内容9
1、实时流处理配置方案及成功案例
内容10
1、实时流计算场景化解决方案项目实战
内容11
1、数据仓库背景介绍2、GaussDB 200 介绍3、融合数仓案例
内容12
融合数仓场景化解决方案项目实战
内容1
数据挖掘概述数据挖掘的流程
内容2
数据预处理与特征工程1
内容3
数据预处理与特征工程2
内容4
分类问题建模
内容5
分类问题建模回归问题建模
内容6
回归问题建模
内容7
聚类算法
内容8
关联算法
内容9
推荐算法
内容10
最优化模型
内容11
模型选择
内容12
分类综合实验
内容13
回归综合实验
内容14
Pyspark mlib 基础入门统计分析
内容15
Pyspark mlib 实验
内容16
华为大数据治理
内容17
综合大实验 1
内容18
综合大实验 2
内容19
综合大实验 3
内容20
综合大实验 4