全部课程> 大数据离线分析项目实践
大数据离线分析项目实践
- 60课时(建议每周学习3小时)
- 录播
-
会新星会员免费观看新9.9元体验新星会员周卡
已有1876人报名学习
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
本门课程主要对天猫订单成交数据,进行数据存储、数据清洗、数据分析、数据可视化等操作,来进行简述关于天猫订单的销售现状、挖掘潜在规律、发现存在问题、提出可行性建议。
课程概览
第1章:介绍了Linux基础知识。
第2章:介绍了 Hadoop集群搭建。
第3章~第5章:介绍了Maven、MapReduce分布式计算框架以及Scala编程语言。
第6章:介绍了Spark大数据处理框架特性。
第7章:介绍了PythonWeb常用前端UI框架、不同数据返回方式。
第8章:介绍了利用SparkSql构建指标,进行项目开发和部署。
授课讲师
熟悉Hadoop,Spark,Redis,Zookeeper,Kafka,ElasticSearch,Sqoop,Flume,Flink等大数据组件;熟悉Mysql,Hbase等数据库编程;熟悉使用Hive 数据仓库;熟悉Java,Python,Scala编程语言;熟悉Linux及 shell 脚本。项目经验:1、电信用户行为分析项目 2、新冠疫情数据平台项目 3、某交友聊天平台数据分析项目 。教学特色:良好课堂组织能力,时刻关注每一位学生,充分调动注意力,通过设计新颖有趣方式来激发学习欲望,教学过程注重基础知识掌握,以及对学生解决问题的能力培养,教学环节层层递进,实现课堂高效。
课程大纲
- 第1章 Linux基础知识
-
    第1节 Linux安装 试听
-
    第2节 Linux命令行 试听
-
    第3节 Linux VIM编辑器
-
    第4节 Linux用户管理
-
    第5节 Linux安装Java环境
-
    第6节 Linux安装MariaDB环境
- 第2章 Hadoop集群搭建
-
    第1节 Hadoop介绍
-
    第2节 Hadoop读写流程
-
    第3节 Hadoop的前期准备
-
    第4节 Hadoop安装
-
    第5节 Hadoop测试
-
    第6节 HDFS的shell命令
- 第3章 Maven的概述
-
    第1节 Maven介绍
-
    第2节 JDK安装
-
    第3节 Maven安装
-
    第4节 Idea集成Maven环境
-
    第5节 Maven POM项目描述
-
    第6节 使用Java操作HDFS数据
- 第4章MapReduce分布式计算框架
-
    第1节 认识MapReduce
-
    第2节 MapReduce工作流程
-
    第3节 MapReduce词频统计
-
    第4节 MapReduce编程示例
-
    第5节 Yarn资源管理器
- 第5章Scala语言基础
-
    第1节 Scala介绍
-
    第2节 Scala安装
-
    第3节 Scala基本语法
-
    第4节 Idea集成Scala环境
-
    第5节 Scala学习步骤
- 第6章Spark大数据处理框架
-
    第1节 Spark介绍
-
    第2节 Spark安装
-
    第3节 Spark RDD常用操作
-
    第4节 Spark词频统计程序
-
    第5节 Spark词频统计编程开发
-
    第6节 Spark词频统计本地调试
-
    第7节 Spark SQL概述
-
    第8节 Spark DataFrames操作
-
    第9节 Spark读写Mysql操作
- 第7章 PythonWeb框架
-
    第1节 PythonWeb前端UI框架
-
    第2节 PythonWeb-Flask框架
-
    第3节 PythonWeb连接Mysql
-
    第4节 饼图通过数据库返回数据
-
    第5节 柱图通过后台返回数据
- 第8章综合案例
-
    第1节 Spark分析天猫的订单数据
-
    第2节 Spark项目工程构建指标
-
    第3节 PythonWeb前端页面实现
-
    第4节 PythonWeb应用开发
-
    第5节 项目程序效果图
实验列表
- 实验名称Linux命令行
- 实验描述在本练习中,您将练习使用Linux的基本命令
- 实验名称Linux VIM编辑器
- 实验描述在本练习中,您将练习使用Linux VIM编辑器
- 实验名称Linux用户管理
- 实验描述本练习中,您将练习使用Linux用户管理
- 实验名称HDFS的shell命令
- 实验描述在本练习中,您将练习使用HDFS、Hadoop分布式文件系统。您将使用HDFS命令行工具来操纵HDFS中的文件
- 实验名称Java程序操作HDFS
- 实验描述在本练习中,您将练习使用Java程序操作HDFS
- 实验名称MapReduce词频统计
- 实验描述在本练习中,您将练习使用MapReduce执行单词统计。
- 实验名称MapReduce编程示例
- 实验描述在本练习中,您将练习使用MapReduce编程示例
- 实验名称Spark RDD常用操作
- 实验描述在本练习中,您将练习Spark RDD常用操作
- 实验名称Spark词频统计程序
- 实验描述在本练习中,您将练习Spark词频统计程序
- 实验名称Spark词频统计编程开发
- 实验描述在本练习中,您将练习使用Spark词频统计编程开发
- 实验名称 Spark读写Mysql操作
- 实验描述在本练习中,您将练习使用Spark读写Mysql操作
- 实验名称Spark项目工程构建指标
- 实验描述在本练习中,您将练习使用Spark项目工程构建指标
- 实验名称 Spark词频统计本地调试
- 实验描述在本练习中,您将练习使用Spark词频统计本地调试
- 实验名称 Spark DataFrames操作
- 实验描述在本练习中,您将练习使用 Spark DataFrames操作
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
csv
tall_sum
大小:1.9MB
2023-04-25
-
pdf
第一章 Linux基础知识
大小:1.45MB
2023-04-25
-
pdf
第二章 Hadoop集群搭建
大小:795.19KB
2023-04-25
-
pdf
第三章 Maven的概述
大小:2.3MB
2023-04-25
-
pdf
第四章 MapReduce分布式计算框架
大小:919.94KB
2023-04-25
-
pdf
第五章 Scala语言基础
大小:1.43MB
2023-04-25