本书阐述语音信息处理的理论与实践内容。全书共8章。第1章介绍语音产生与感知机理,以及与此相关的语言基础知识,是全书的理论基础。第2章介绍语音信号处理基础,包括语音产生与感知的数学模型、语音听觉的数学模型、时域语音信号处理方法、基于产生机理的语音信号处理方法以及基于感知机理的语音信号处理方法。第3章介绍语音识别的原理与技术,重点介绍基于隐马尔可夫模型和基于深度学习的声学模型、语言模型、语音识别解码算法、语音识别技术展望以及基于HTK、Kaldi等工具的相关实践。第4章介绍语音合成原理与技术,主要包括语音合成的原理、基于深度神经网络和端到端的语音合成方法。第5章介绍语音增强的原理与技术,涉及单通道及多通道的各种语音增强算法以及相关实践。第6章介绍说话人识别原理与技术,包含传统说话人识别算法以及基于深度学习的说话人识别算法,最后介绍相关实践。第7章介绍语音对话系统,主要涉及任务型语音对话系统、闲聊系统以及相关实践。第8章介绍语音信息处理前瞻技术。
本书可作为高等学校人工智能专业、计算机科学与技术专业的本科高年级学生、研究生相关课程教材,也可作为从事语音信息处理工作的专业技术人员的参考读物。