- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
- 课程概览
- 授课讲师
- 课程大纲
- 实验列表
语言识别是一门研究如何让计算机能够理解和处理人类语言的学科。这门课程旨在介绍语言识别的基本原理、技术和应用,以及相关领域的最新研究进展。
课程概览
课程内容:
-
语音信号处理基础: 介绍语音信号的特性和数字信号处理的基本概念,包括音频采样、滤波、频谱分析等。
-
语音特征提取: 学习如何从语音信号中提取有用的特征,如短时能量、过零率、梅尔频率倒谱系数(MFCC)等。
-
隐马尔可夫模型(HMM): 研究HMM在语言识别中的应用,包括声学建模和语言建模。
-
音素识别: 探讨音素识别的基本原理和方法,包括基于HMM的音素识别算法和训练过程。
-
语音识别系统架构: 介绍典型的语音识别系统架构,包括前端特征提取、声学建模、语言模型等组成部分。
-
深度学习在语音识别中的应用: 引入深度学习技术在语音识别中的应用,包括卷积神经网络(CNN)、循环神经网络(RNN)和长短期记忆网络(LSTM)等。
授课讲师
腾讯云社区年度最佳作者,csdn博客专家。 参与iVX低代码平台网站海外版编写重构,编写小型开源Web框架。 熟练掌握C、Python、Java等语言;PythonWeb、Android开发、计算机视觉、自然语言处理。 熟悉js、kotlin等语言;熟悉vue、react等前端框架。熟悉OpenCV、Sklearn、Pytorch等框架和模块。熟悉各种神经网络,如DNN、CNN、RNN、word2vec,熟悉attention机制以及bert预训练模型。 上课理论实践结合,例子新颖,案例贴近生活,把技术带入生活。 循循善诱,平易近人;注意启发和调动学生的积极性,课堂气氛较为活跃;例题丰富,不厌其烦,细心讲解,虚心并广泛听取学生的意见和反馈信息,做到及时修正和调整自己的知识的传授方式。
课程大纲
- 第1章语音处理介绍
-
    第1节 语音处理介绍
-
    第2节 语音预处理基础
-
    第3节 语音信号分析及特征提取
- 第2章语音识别
-
    第1节 语音识别
- 第3章语音合成
-
    第1节 语音合成
- 第4章传统声学模型GMM-HMM
-
    第1节 GMM
-
    第2节 HMM
-
    第3节 GMM+HMM
实验列表
- 实验名称语音特征提取
- 实验描述语音是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中都需要提取语音中包含的各种信息。一般而言,语音数据处理的目的有两种:一种是对语音信号进行分析,提取特征参数,用于后续处理;另一种是加工语音信号,例如在语音增强中对含噪语音进行背景噪声抑制,以获得相对“干净”的语音;在语音合成方法中需要对分段语音进行拼接平滑,获得主观音质较高的合成语音,这方面的应用同样是建立在分析并提取语音信号信息的基础上的。总之,语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。 根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。 本实验就是基于开源的短序列语音数据集对语音数据本身的属性,以及相关特征属性进行分析与解析,以求对语音数据有更加深入全面的了解。
- 实验名称基于seq2seq的语音识别
- 实验描述RNN比较适合序列类型的数据的建模,语音就是此种类型的数据,所以RNN相对图像,更适配这种序列类型的语音数据,对语音进行识别。Seq2Seq正是利用了RNN系列的模型,成为一种独特的模型结构,非常适合输入是序列、输出也是序列的情形。
- 实验名称隐马尔可夫模型预测地震
- 实验描述使用hmm模型理解地震
节数 | 上课时间 | 星期一 | 星期二 | 星期三 | 星期四 | 星期五 | 星期六 | 星期天 |
---|---|---|---|---|---|---|---|---|
第1节 | 08:00 - 08:40 | |||||||
第2节 | 09:00 - 09:40 | |||||||
第3节 | 10:00 - 10:40 | |||||||
第4节 | 11:00 - 11:40 | |||||||
第5节 | 14:00 - 14:40 | |||||||
第6节 | 15:00 - 15:40 | |||||||
第7节 | 16:00 - 16:40 | |||||||
第8节 | 17:00 - 17:40 |
天数 | 上课日期 | 上课时间 | 内容 |
---|
相关课件 更多
-
pptx
语音处理
大小:8.12MB
2023-08-29