- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
随着云时代的来临,数据分析技术将帮助企业用户在合理时间内获取、管理处理以及整理海量数据,为企业经营决策提供积极的帮助。数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略性新兴产业。我国目前大数据处于高速发展阶段,其商业价值已经显现出来,特别是有实践经验的数据分析人才更是各企业争夺的热门。
课程概览
Python 数据分析是一个强大且灵活的过程,它依赖于Python语言的多种库和工具,这些库和工具使得数据处理、清洗、分析、可视化以及机器学习模型的构建变得简单高效。
数据分析基本步骤
1.数据收集:从数据库、文件、网络或API等数据源获取数据。
2.数据清洗:处理缺失值、异常值、重复数据等,确保数据的质量和一致性。
3.数据探索:使用统计方法和可视化工具对数据进行分析,了解数据的分布、趋势和相关性等。
4.数据转换:根据需要对数据进行格式转换、编码转换、归一化/标准化等处理。
5.数据建模:选择合适的算法和模型对数据进行建模,如分类、回归、聚类等。
6.模型评估:使用测试集评估模型的性能,如准确率、召回率、F1分数等。
7.结果解释与应用:解释模型的结果,并将其应用于实际问题解决中。
8.报告撰写:将数据分析的过程、结果和结论整理成报告,供决策者参考。
通过掌握这些库和步骤,你可以有效地进行Python数据分析,从而解决各种实际问题。
T培训提供订阅式灵活学习模式,涵盖在线直播、面授课程及视频订阅服务,特设Python数据分析课程,满足多样化学习需求。
授课讲师
专业成就: 拥有华为双IE专家资格认证,在云计算与云服务领域具有专业权威。 技术文章《云上主机安全设计》获得业界认可,阅读量达1700次。 教学风格: 授课方式通俗易懂,强调互动,营造生动有趣的课堂氛围。 通过课后讨论,加深学生对技术的理解,提升学习热情。 学术地位: 作为高校客座教授,享有学术界和业界的广泛认可。 擅长技术领域: 精通云计算架构设计、云服务管理与优化。 擅长云主机安全策略规划与实施。 熟练掌握虚拟化技术、容器化部署和自动化运维。
课程大纲
- 第1章数据分析概述
-
    第1节 认识数据分析
-
    第2节 Python数据分析的工具
-
    第3节 安装Python的Anaconda发行版
-
    第4节 掌握Jupyter Notebook常用功能
- 第2章NumPy数值计算基础
-
    第1节 NumPy数组对象ndarray
-
    第2节 NumPy矩阵、线性代数运算与通用函数
-
    第3节 利用NumPy进行统计分析
- 第3章Pandas基础
-
    第1节 读/写不同数据源的数据
-
    第2节 DataFrame数据结构
-
    第3节 转换与处理时间序列数据
-
    第4节 使用分组聚合进行组内计算
-
    第5节 创建透视表与交叉表
- 第4章使用Pandas进行数据预处理
-
    第1节 合并数据
-
    第2节 清洗数据
-
    第3节 标准化数据
-
    第4节 转换数据
- 第5章Matplotlib、seaborn、pyecharts数据可视化基础
-
    第1节 Matplotlib基础绘图
-
    第2节 seaborn绘图基础
-
    第3节 pyecharts绘图基础
- 第6章使用scikit-learn构建模型
-
    第1节 使用sklearn转换器处理数据
-
    第2节 构建并评价聚类模型
-
    第3节 构建并评价分类模型
-
    第4节 构建并评价回归模型
- 第7章综合案例:航空公司客户价值分析
-
    第1节 了解航空公司现状与客户价值分析
-
    第2节 预处理航空客户数据
-
    第3节 使用K-Means算法进行客户分群
实验列表
- 实验名称Numpy数值计算基础
- 实验描述根据“某门课程平时成绩和期末考试成绩.xlsx”内容,计算课程的平时成绩和期末考试成绩的均值、标准差、方差、最小值、最大值,输出期末考试成绩排名有进步学生的名单。
- 实验名称pandas基础
- 实验描述完成创建员工收入信息的数据集,并对该数据集进行增、删、改、查的操作。 (1)创建一个包含有5位员工姓名、性别、年龄和月工资收入的数据集,数据集中的数据读者可以自拟。 (2)选择数据集中月工资收入这列数据。 (3)在增加一位员工收入信息,数据为(赵一平,男,34,7000)。 (4)将员工姓名为“李明”的月工资收入修改为8000。 (5)删除第2位员工的数据。 (6)筛选出月工资收入大于6000元的员工的数据。
- 实验名称pandas数据处理
- 实验描述按照已有的表格完成要求的操作
- 实验名称Matplotlib数据可视化基础
- 实验描述populations.npz包含我国1996~2015年人口特征数据(有6个特征:年末总人口中、男性人口、女性人口、城镇人口、农村人口和年份)。请先用numpy的load()读出数据,并根据下列要求,参考课件程序,编程绘制相应图形:
- 实验名称scikit-learn构建模型
- 实验描述(1)加载 iris 数据集,并划分训练集、测试集。 (2)对 iris 数据集使用PCA 降维,目的是把现有的4 维数据减少到3 维,这样处理可以减少数据维度,保留各数据的主要特征。要求是使用 PCA 构造函数,用 n components参数指定鸢尾花的维度为 3。 (3)使用 SVM对 ris 数据集进行分类,并评价
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
csv
某门课程平时成绩和期末考试成绩.csv
大小:5.45KB
2023-08-04
-
npz
populations.npz
大小:2.26KB
2023-08-04
-
pptx
第一章 python数据分析概述
大小:1.32MB
2023-08-04
-
pptx
第二章 Numpy数值计算基础
大小:249.2KB
2023-08-04
-
pptx
第三章 pandas基础
大小:298.69KB
2023-08-04
-
pptx
第四章 使用pandas进行数据预处理
大小:347.83KB
2023-08-04