HCIE-BigData课程是专为培养大数据领域高级专业人才而设计,它深入涉及大数据挖掘与分析的高级技能。课程内容不仅包括数据预处理与特征工程、回归与分类问题建模、聚类与降维问题建模、关联分析与推荐问题建模等关键知识,还涵盖了模型评估与优化、Python数据挖掘案例分析、PySpark MLlib等实用技术。此外,课程特别强调了对华为大数据平台MRS的实操能力培养,以及华为数据治理中心DataArts Studio的应用,使学员能够全面掌握大数据解决方案的设计与实施。
通过深入学习,学员将能够熟练运用华为大数据技术,进行高效的数据挖掘和分析,解决复杂的大数据问题,并为通过HCIE-BigData认证做好充分准备。课程内容丰富,结合理论学习与实践操作,旨在提升学员在大数据领域的专业水平,培养其成为能够独立承担大数据项目的专家。
HCIA-Big Data
HCIP-Big Data
HCIE-Big Data
内容1
大数据发展趋势与鲲鹏大数据HDFS 分布式文件系统原理
内容2
ZooKeeper 分布式协调服务HBase 分布式数据库技术
内容3
Hive 分布式数据仓库技术
内容4
ClickHouse 联机分析数据库管理系统MapReduce 与 Yarn 技术原理
内容5
Spark 基于内存的分布式计算
内容6
Flink 流批一体分布式实时处理引擎Flume 海量日志聚合技术
内容7
Kafka 分布式消息订阅系统ElasticSearch 分布式全文检索服务
内容8
华为大数据平台 MRS数据治理中心 DataArtsStudio
内容1
1、大数据主流技术2、大数据场景化解决方案3、大数据应用开发
内容2
1、Java 开发环境配置2、Maven 环境配置3、开发工具介绍、集成maven4、Java 基础语法、对象和类5、Java 循环结构、Java 条件语句6、Java 集合List,Set,Map
内容3
1、离线批处理方案2、离线批处理组件的介绍、技术原理、参数属性、重要配置等,包括数据存储 HDFS
内容4
1、Java 连接操作 HDFS2、数据仓库 Hive3、java 连接操作 Hive
内容5
1、离线批处理方案2、离线批处理组件的介绍、技术原理、参数属性、重要配置等,包括数据存储 HDFS,数据仓库Hive
内容6
1、离线分析 SparkSQL2、数据集成工具 Loader、Sqoop、Kettle 等3、离线批处理实际案例
内容7
1、实时检索场景方案2、分布式数据库介绍、技术原理、参数属性、重要配置等,包括 Hbase、ElasticSearch、GraphBase 等3、实时检索实际案例
内容8
1、实时流计算应用方案2、实时流计算组件的介绍、技术原理、参数属性、重要配置等,包括Flume、Kafka、Flink、SparkStre 上午 ing、Redis 等
内容9
1、实时流处理配置方案及成功案例
内容10
1、实时流计算场景化解决方案项目实战
内容11
1、数据仓库背景介绍2、GaussDB 200 介绍3、融合数仓案例
内容12
融合数仓场景化解决方案项目实战
内容1
数据挖掘概述数据挖掘的流程
内容2
数据预处理与特征工程1
内容3
数据预处理与特征工程2
内容4
分类问题建模
内容5
分类问题建模回归问题建模
内容6
回归问题建模
内容7
聚类算法
内容8
关联算法
内容9
推荐算法
内容10
最优化模型
内容11
模型选择
内容12
分类综合实验
内容13
回归综合实验
内容14
Pyspark mlib 基础入门统计分析
内容15
Pyspark mlib 实验
内容16
华为大数据治理
内容17
综合大实验 1
内容18
综合大实验 2
内容19
综合大实验 3
内容20
综合大实验 4