全部课程> 人工智能与机器学习

人工智能与机器学习
- 48课时(建议每周学习0小时)
- 录播
-
会新星会员免费观看新9.9元体验新星会员周卡
已有2039人报名学习
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
本课程以机器学习算法为主体,讲解各种机器学习算法。主要内容如下:监督学习算法、分类与回归、线性回归、逻辑回归、决策树、随机森林、SVM、无监督学习、数据预处理、Tfidf等。 在讲解算法过程中,以实际的例子和可视化的方式形象理解。部分算法会讲解实际算法推导。在讲解完每个算法后,都会用sklearn解决一个具体的问题。
课程概览
本课程以机器学习算法为主体,讲解各种机器学习算法。在讲解算法过程中,以实际的例子和可视化的方式形象理解。部分算法会讲解实际算法推导。在讲解完每个算法后,都会用sklearn解决一个具体的问题。可以强化对算法的理解。
在课程后半部分,主要讲解模型调参以及特征工程相关的内容。让我们可以应对各种问题,最后在课程中附带了几个实验。实验选取sklearn以外的数据集,在实验中会实现对数据的处理以及预测的功能,方便把实验应用于生活中。
二、课程目标
掌握分类与回归算法
理解各种机器学习算法
掌握解决过拟合的方法
掌握读取数据、数据预处理、异常数据处理等操作
掌握sklearn模块的使用
第一阶段:监督学习
在该阶段,主要学习机器学习的基本概念。学习监督学习中的各种分类和回归算法。包括KNN、线性回归、逻辑回归、决策树、随机森林、支持向量机、神经网络。
第二阶段:无监督学习
在该阶段,主要学习数据缩放方法和无监督学习算法。包括数据标准化、归一化、PCA主成分分析、聚类算法等。
第三阶段:特征工程
在该阶段,主要学习特征的表示。包括分类特征处理、分箱离散化、多项式特征、文本特征、Ngram、Tfidf。同时还会讲解模型评估和改进的方法。
授课讲师

腾讯云社区年度最佳作者,csdn博客专家。 参与iVX低代码平台网站海外版编写重构,编写小型开源Web框架。 熟练掌握C、Python、Java等语言;PythonWeb、Android开发、计算机视觉、自然语言处理。 熟悉js、kotlin等语言;熟悉vue、react等前端框架。熟悉OpenCV、Sklearn、Pytorch等框架和模块。熟悉各种神经网络,如DNN、CNN、RNN、word2vec,熟悉attention机制以及bert预训练模型。 上课理论实践结合,例子新颖,案例贴近生活,把技术带入生活。 循循善诱,平易近人;注意启发和调动学生的积极性,课堂气氛较为活跃;例题丰富,不厌其烦,细心讲解,虚心并广泛听取学生的意见和反馈信息,做到及时修正和调整自己的知识的传授方式。
课程大纲
- 第1章前言
-
    第1节 机器学习 试听
-
    第2节 必要的库和工具 试听
-
    第3节 认识数据
-
    第4节 第一个应用:鸢尾花分类
- 第2章监督学习
-
    第1节 分类与回归
-
    第2节 泛化、过拟合和欠拟合
-
    第3节 监督学习算法
-
    第4节 KNN算法
-
    第5节 调参及距离的度量
- 第3章回归算法
-
    第1节 线性回归
-
    第2节 梯度下降
-
    第3节 岭回归
-
    第4节 Lasso回归
- 第4章逻辑回归
-
    第1节 逻辑回归
-
    第2节 Softmax回归
-
    第3节 代码实现
-
    第4节 参数调整
- 第5章决策树和随机森林
-
    第1节 决策树
-
    第2节 决策树的生成
-
    第3节 过拟合
-
    第4节 代码实现和决策树分析
-
    第5节 随机森林
- 第6章支持向量机
-
    第1节 线性支持向量机
-
    第2节 线性模型和非线性特征
-
    第3节 核支持向量机
-
    第4节 参数调整
- 第7章神经网络
-
    第1节 线性代数
-
    第2节 神经网络
-
    第3节 反向传播
-
    第4节 代码实现
- 第8章数据缩放
-
    第1节 数据缩放
-
    第2节 相同的缩放
-
    第3节 数据缩放对结果的影响
-
    第4节 无监督学习
-
    第5节 K-means
-
    第6节 DBSCAN
- 第9章PCA主成分分析
-
    第1节 PCA主成分分析
-
    第2节 主成分
-
    第3节 数据可视化
-
    第4节 分析成分
- 第10章数据表示与特征工程
-
    第1节 分类特征
-
    第2节 分箱、离散化
-
    第3节 交互特征与多项式特征
-
    第4节 缺失值特征
- 第11章模型评估与改进
-
    第1节 拆分数据集
-
    第2节 交叉验证
-
    第3节 网格搜索
-
    第4节 交叉验证网格搜索
- 第12章处理文本数据
-
    第1节 词袋模型
-
    第2节 停用词
-
    第3节 Tf-idf
-
    第4节 N-gram
-
    第5节 朴素贝叶斯
实验列表
- 实验名称疫情增加人数预测
- 实验描述疫情已经肆虐了几年,对我们的生活带了了很多不便。关于疫情何时结束,兰州大小做了相关的系统用于预测疫情相关数据。《新冠肺炎疫情全球预测系统》(GPCP)基于实时更新的流行病数据,对每个国家的逐日和季节性新增新冠肺炎发病数进行可靠预报。模型的第一版使用了改良的SIR流行病模型,该模型结合了全球真实流行病数据,同时考虑气象因素和隔离措施对于COVID-19传播的影响。第二版使用了更复杂的SEIR模型。在这一版本中,我们考虑了社区解封时间以及市民自我隔离对于疫情发展的影响。第二版模型可以用来进行季节性预测及疫情的二次暴发的预测。模型的参数通过真实流行病数据反演得到。与此同时,我们利用EEMD-ARMA方法对预测结果进行修正,以得到更优的预测效果。 在本次实验中,我们会对《新冠肺炎疫情全球预测系统》进行简单的实现。我们利用历史的新增人数训练一个线性回归模型,然后预测往后的新增人数。
- 实验名称心脏病病发检测
- 实验描述本实验使用下面结果特征作为判断依据: - Age:患者年龄 - Sex:性别 - exang:运动诱发的心绞痛(1 = 是;0 = 否) - ca:主血管数量(0-3) - cp:胸痛型 - 值 1:典型心绞痛 - 值 2:非典型心绞痛 - 值3:非心绞痛 - 值 4:无症状 - trtbps:静息血压(毫米汞柱) - chol:通过 BMI 传感器获取的以 mg/dl 为单位的胆甾醇 - fbs:(空腹血糖 > 120 mg/dl)(1 = 真;0 = 假) - rest_ecg : 静息心电图结果 - 值 0:正常 - 值 1:ST-T 波异常(T 波倒置和/或 ST 段抬高或压低 > 0.05 mV) - 值 2:根据埃斯蒂斯标准显示可能或明确的左心室肥厚 - thalach : 达到最大心率 训练一个心脏病病发检测的程序。
- 实验名称手写数字识别
- 实验描述手写数字识别是模式识别领域的一个重要分支,它研究的核心问题是:如何利用计算机自动识别人手写在纸张上的阿拉伯数字。本实验使用神经网络,来进行手写数字识别。手写数字识别可以看成10分类的图像分类问题,我们把图像像素作为特征,把对应的数字作为目标。
- 实验名称图像分割
- 实验描述图像分割可以认为是对像素点的分类问题。实现图像分割的方法多种多样,包括Otsu、Faster-RCNN、SSD等。本次使用使用无监督学习算法Kmeans实现简单的图像分割。
- 实验名称泰坦尼克生还预测
- 实验描述泰坦尼克生还预测是一个非常经典的问题,记录了泰坦尼克号乘客的各种信息以及是否生还。该数据集包含缺失值,并且包含分类数据。该数据集无法直接交给机器学习模型训练,需要进行处理。
- 实验名称泰坦尼克生还预测
- 实验描述泰坦尼克生还预测是一个非常经典的问题,记录了泰坦尼克号乘客的各种信息以及是否生还。该数据集包含缺失值,并且包含分类数据。该数据集无法直接交给机器学习模型训练,需要进行处理。
- 实验名称情感分析
- 实验描述对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情 感、情绪、评价和态度的计算研究。文本情感分析(Sentiment Analysis)是自然语言处理(NLP)方法中常见的应用,也是一个有趣的基本任务,尤其是以提炼文本情绪内容为目的的分类。它是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。 这里将介绍情感分析中的情感极性(倾向)分析。所谓情感极性分析,指的是对文本进行褒义、贬义、中性的判断。在大多应用场景下,只分为两类。例如对于“喜爱”和“厌恶”这两个词,就属于不同的情感倾向。
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
csv
heart.csv
大小:11.06KB
2023-01-11
-
zip
图像分割.zip
大小:286.37KB
2023-01-11
-
zip
pos.zip
大小:9.74MB
2023-01-11
-
zip
neg.zip
大小:9.51MB
2023-01-11
-
zip
泰坦尼克.zip
大小:33.01KB
2023-01-11
-
zip
疫情.zip
大小:912.76KB
2023-01-11