- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
通过本课程的学习:学员可以掌握Linux的相关技术,Hadoop的入门知识,DHFS集群的搭建和工作机制、MAPREDUCE的原理和实践、zookeeper集群的搭建、HBASE的安装和开发原理、日志采集框架flume,kafka数据处理、Spark集群的搭建和使用等知识
课程概览
授课讲师
擅长管理系统的开发;数据分析与统计;容器虚拟化;系统运维 熟悉使用Java,Spring,SpringMVC,Springboot,Mybatis等框架进行企业级开发; 熟悉使用Python,GO,shell等语言 熟悉基于Msql,sqlserver,Oracle等多种数据库编程; 熟悉Msql数据库主从复制,读写分离等技术使用,非关系型数据库Redis集群搭建部署和管理 熟悉Linux平台操作,云计算,容器虚拟化技术等; 熟悉Redis,Solr,Nginx,ElasticSearch,Apache集群,负载均衡等高并发组件; 熟悉Hadoop,Hive,Spark,Sqoop,Fiume,HBase等大数据组件 熟悉 Docker;了解 kubernetes 容器集群管理及部署 熟悉 Zabbix 的服务监控以及触发报警相关的配置
课程大纲
- 第1章Linux相关技术
-
    第1节 课程大纲介绍
-
    第2节 安装redhat
-
    第3节 redhat自动分配ip设置
-
    第4节 xshell连接虚拟机
-
    第5节 linux系统结构讲解
-
    第6节 文件系统介绍
-
    第7节 chmod修改文件权限
-
    第8节 chown&chgrp
-
    第9节 常用命令
-
    第10节 安装jdk
-
    第11节 yum配置
-
    第12节 安装mysql
- 第2章Hadoop入门
-
    第1节 hadoop概述
-
    第2节 hadoop应用
-
    第3节 离线数据分析流程
- 第3章搭建Hadoop集群
-
    第1节 准备linux环境
-
    第2节 安装hadoop集群
-
    第3节 配置ssh免登陆
- 第4章Hadoop集群配置常用参数HDFS工作机制
-
    第1节 hdfs概述和结构
-
    第2节 hdfs命令基本使用
-
    第3节 hdfs写数据过程讲解
-
    第4节 hdfs读数据过程讲解
-
    第5节 namenode工作机制总体原则
-
    第6节 secondnamenode checkpoint机制
-
    第7节 datanode工作机制
-
    第8节 java client操作hdfs
-
    第9节 yarn框架介绍
-
    第10节 定时调度器使用讲解
-
    第11节 定时采集数据作业需求介绍
-
    第12节 shell采集脚本讲解
- 第5章MAPREDUCE详解
-
    第1节 为什么要使用mapreduce
-
    第2节 mapreduce核心思想和运行机制
-
    第3节 mapreduce并行度决定机制
-
    第4节 mr实现单词统计例子讲解
-
    第5节 wordcount运行过程分析
-
    第6节 mr的shuffle机制
-
    第7节 mapreduce全过程简单分析
- 第6章zookeeper
-
    第1节 zookeeper概述
-
    第2节 zookeeper集群机制
-
    第3节 Zookeeper安装
-
    第4节 zookeeper结构和命令
-
    第5节 zookeeper原理
- 第7章Hbase
-
    第1节 hbase简介
-
    第2节 habse安装
-
    第3节 hbase依赖zookeeper
-
    第4节 hbase开发
-
    第5节 hbase原理
-
    第6节 MapReduce操作Hbase
- 第8章HIVE详解
-
    第1节 Hive简介
-
    第2节 Hive架构
-
    第3节 HIVE的安装部署
-
    第4节 Hive基本操作
-
    第5节 Hive函数
- 第9章辅导工具
-
    第1节 flume简介
-
    第2节 flume采集网络数据
-
    第3节 flume采集目录日志文件
-
    第4节 flume采集文件和发送到另一个agent
-
    第5节 sqoop工具使用介绍
- 第10章Spark基础
-
    第1节 spark概述
-
    第2节 spark安装
-
    第3节 使用Spark
-
    第4节 scala
-
    第5节 创建和运行spark应用
-
    第6节 Spark RDD
-
    第7节 统计访问网站次数
-
    第8节 SparkSQL概述及简单使用
-
    第9节 SparkSQL编程
-
    第10节 Spark streaming概述
-
    第11节 Spark streaming编程
- 第11章kafka
-
    第1节 kafka简介
-
    第2节 kafka安装及常用命令
-
    第3节 kafka的使用
-
    第4节 redis
- 第12章项目实战
-
    第1节 spark环境搭建
-
    第2节 点击流项目之采集功能
-
    第3节 点击流项目之移动数据到预处理目录
-
    第4节 点击流项目之清洗数据
-
    第5节 点击流项目之导入清理之后的数据
-
    第6节 点击流项目之数据统计
实验列表
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
pdf
01HADOOP快速入门
大小:1.19MB
2020-04-27
-
pdf
02HDFS详解
大小:2.03MB
2020-04-27
-
pdf
03MAPREDUCE详解
大小:1.87MB
2020-04-27
-
pdf
04Zookeeper
大小:647.27KB
2020-04-27
-
pdf
05hbase随堂笔记
大小:884.36KB
2020-04-27
-
pdf
06Hive随堂笔记
大小:3.29MB
2020-04-27