- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
数据挖掘原理与应用
数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。本课程内容主要包含了数据挖掘使用的常用的算法,方法。结合机器学习,让同学了解数据挖掘的知识。
课程概览
课程概述: 本课程旨在帮助学生打下数据挖掘与机器学习的坚实基础,涵盖了从数学和Python基础到实际数据挖掘流程的全面内容。无论您是初学者还是希望巩固知识的学习者,这门课程都将提供丰富的知识和实践机会。
课程内容包括:
- 数学基础:线性代数:掌握矩阵、向量、线性变换等基本概念,为理解模型背后的数学原理打下基础。统计学:学习概率、分布、统计检验等,以便进行数据分析和模型评估。
- Python基础:学习Python编程语言,包括语法、数据结构、条件语句和循环。掌握NumPy和Pandas库,用于数据处理和分析。数据可视化工具:使用Matplotlib和Seaborn创建可视化图表,以更好地理解数据。
- 数据预处理:数据清洗:处理缺失值、异常值和重复数据,确保数据质量。数据转换:标准化、归一化、编码等,以便模型处理。特征选择:确定哪些特征对模型有意义,提高模型性能。
- 特征工程:特征提取:从原始数据中提取新特征,改善模型的表现。特征转换:应用数学变换,如对数、指数、多项式,以改善特征的分布。特征选择:使用统计或机器学习方法选择最相关的特征。
- 数据挖掘算法:介绍常见的数据挖掘算法,包括分类、聚类、关联规则挖掘、异常检测等。学习算法的原理、应用场景和实现方法。
- 模型评估与验证:讨论如何评估和验证数据挖掘模型的准确性和稳定性。学习使用交叉验证、混淆矩阵和ROC曲线等方法来评估模型性能。
- 实际案例与项目:通过实际案例和项目,将所学知识应用到实际问题中。学生将有机会运用数据挖掘技术来解决真实世界的挑战,并从中获得实际操作和解决问题的经验。
授课讲师
担任人工智能讲师多年,擅长机器学习、深度学习、机器视觉的相关课程。华为人工智能开发者。同时还兼任python数据挖掘分析课程,授课风格通俗易懂,课堂中善于用生活例子帮助学生理解知识点。
课程大纲
- 第1章绪论
-
    第1节 数据挖掘的出现
-
    第2节 什么是数据挖掘和数据挖掘的内容
- 第2章认识数据
-
    第1节 数据的概念和统计方法
-
    第2节 数据的基本可视化
-
    第3节 数据相似性的计算方法
- 第3章数据预处理
-
    第1节 数据质量
-
    第2节 数据处理主要任务
- 第4章分类的基本概念和朴素贝叶斯分类器
-
    第1节 概述
-
    第2节 朴素贝叶斯分类器
-
    第3节 案例
- 第5章决策树分类
-
    第1节 决策树和构建问题
-
    第2节 决策树算法
- 第6章规则和最近邻分类
-
    第1节 基于规则分类
-
    第2节 最近邻分类
- 第7章回归算法
-
    第1节 线性回归
-
    第2节 逻辑回归
-
    第3节 优化算法求解
- 第8章模型的评价
-
    第1节 评价指标
-
    第2节 过拟合和欠拟合
- 第9章支持向量机分类器
-
    第1节 支持向量机的提出
-
    第2节 深入支持向量机
-
    第3节 非线性支持向量机
- 第10章神经网络分类器
-
    第1节 感知机
-
    第2节 反向传播算法
- 第11章关联规则挖掘
-
    第1节 定义
-
    第2节 Apriori算法
-
    第3节 FP-Growth算法
-
    第4节 挖掘关联规则
- 第12章信息推荐算法
-
    第1节 经典信息推荐算法
- 第13章聚类算法
-
    第1节 聚类概述
-
    第2节 基本聚类方法
-
    第3节 聚类评估
实验列表
- 实验名称数据预处理
- 实验描述使用相关的数据处理模块实现数据预处理操作
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
pptx
第一章-绪论
大小:18.56MB
2023-07-04
-
pptx
第十章 神经网络
大小:3.52MB
2023-07-04
-
pptx
第十二章 信息推荐
大小:5.07MB
2023-07-04
-
pptx
第十三章 聚类
大小:5.67MB
2023-07-04
-
pptx
第十一章 关联规则挖掘
大小:2.54MB
2023-07-04
-
pptx
第七章 分类方法
大小:3.16MB
2023-07-04