顶部
收藏

自然语言处理


作者:
刘挺、秦兵、赵军、黄萱菁、车万翔
定价:
54.00元
ISBN:
978-7-04-056177-7
版面字数:
490.000千字
开本:
16开
全书页数:
暂无
装帧形式:
平装
重点项目:
暂无
出版时间:
2021-12-06
读者对象:
高等教育
一级分类:
计算机/教育技术类
二级分类:
计算机类专业核心课程
三级分类:
人工智能

本书在新一代人工智能背景下,重点介绍自然语言处理的基础知识、主要的经典技术、前沿技术及应用。本书分为四部分内容进行阐述:基础知识、自然语言处理的基础技术、自然语言处理的应用技术、自然语言处理的应用系统。首先,在基础知识部分,介绍了语言学理论和机器学习理论两个方面的基础。其次,介绍自然语言处理中的基础技术,包括语言模型、词法分析、句法分析和语义分析等内容。然后,通过文本的信息抽取、篇章分析、情感分析及文本生成等任务,介绍自然语言处理的应用技术。最后,在自然语言处理的应用系统方面,详细介绍了问答系统、对话系统和机器翻译中的相关技术和系统结构等内容。

本书可作为人工智能专业、智能科学与技术专业以及计算机类相关专业的本科生及研究生学习自然语言处理的教材,也可以作为自然语言方向相关研究人员的参考用书。

  • 前辅文
  • 第1章 绪论
    • 1.1 自然语言处理的定义
    • 1.2 自然语言处理的研究内容
      • 1.2.1 资源建设
      • 1.2.2 基础研究
      • 1.2.3 应用技术研究
      • 1.2.4 应用系统
    • 1.3 自然语言处理的流派
      • 1.3.1 基于规则的自然语言处理
      • 1.3.2 基于统计学习的自然语言处理
      • 1.3.3 基于深度学习的自然语言处理
    • 1.4 自然语言处理的挑战
    • 1.5 本书各章节内容概述
    • 参考文献
  • 第2章 现代语言学基础
    • 2.1 语言学与人类的语言
      • 2.1.1 现代语言学的起源及学科分支
      • 2.1.2 人类语言的符号性与层级性
    • 2.2 语言系统及其知识模型
      • 2.2.1 语音系统
      • 2.2.2 词汇系统
      • 2.2.3 句法系统
      • 2.2.4 语义系统
      • 2.2.5 语用系统
    • 2.3 语言的歧义性与创造性
      • 2.3.1 歧义性
      • 2.3.2 创造性
    • 2.4 语言知识资源
    • 2.5 延伸阅读
    • 习题
    • 参考文献
  • 第3章 形式语言与自动机
    • 3.1 基本概念
      • 3.1.1 字母表、符号串及语言
      • 3.1.2 文法
      • 3.1.3 自动机
    • 3.2 正则文法与有穷自动机
      • 3.2.1 正则表达式与正则文法
      • 3.2.2 有穷自动机
      • 3.2.3 在自然语言处理中的应用
    • 3.3 上下文无关文法和下推自动机
      • 3.3.1 上下文无关文法
      • 3.3.2 下推自动机
      • 3.3.3 在自然语言处理中的应用
    • 习题
    • 参考文献
  • 第4章 机器学习基础
    • 4.1 机器学习概述
      • 4.1.1 机器学习的三个基本要素
      • 4.1.2 泛化与正则化
      • 4.1.3 机器学习算法的类型
    • 4.2 线性分类器
      • 4.2.1 logistic 回归
      • 4.2.2 softmax 回归
      • 4.2.3 感知器
      • 4.2.4 支持向量机
    • 4.3 结构化学习
      • 4.3.1 结构化感知器
      • 4.3.2 隐马尔可夫模型
      • 4.3.3 条件随机场
    • 4.4 神经网络与深度学习
      • 4.4.1 前馈神经网络
      • 4.4.2 卷积神经网络
      • 4.4.3 循环神经网络
      • 4.4.4 注意力机制
    • 4.5 总结和延伸阅读
    • 参考文献
  • 第5章 文本表示
    • 5.1 词的表示
      • 5.1.1 分布式语义假设
      • 5.1.2 布朗聚类
      • 5.1.3 潜在语义分析
      • 5.1.4 神经词嵌入
      • 5.1.5 评价
    • 5.2 短语和句子表示
      • 5.2.1 词袋模型
      • 5.2.2 基于神经网络的组合语义模型
      • 5.2.3 通用表示学习目标
    • 5.3 延伸阅读
    • 习题
    • 参考文献
  • 第6章 语言模型
    • 6.1 n 元语言模型
      • 6.1.1 n 元语法
      • 6.1.2 最大似然估计
      • 6.1.3 语言模型性能评价
      • 6.1.4 平滑
    • 6.2 神经网络语言模型
      • 6.2.1 前馈神经网络语言模型
      • 6.2.2 循环神经网络语言模型
    • 6.3 预训练语言模型
      • 6.3.1 单向语言模型预训练
      • 6.3.2 双向语言模型预训练
      • 6.3.3 掩码语言模型预训练
    • 6.4 延伸阅读
    • 习题
    • 参考文献
  • 第7章 词法分析
    • 7.1 词形分析
      • 7.1.1 英语词形变化概述
      • 7.1.2 词形分析算法
    • 7.2 词语切分
      • 7.2.1 中文分词概述
      • 7.2.2 中文分词方法
      • 7.2.3 中文分词语料
    • 7.3 词性标注
      • 7.3.1 词性标注概述
      • 7.3.2 词性标注方法
      • 7.3.3 主要数据集
    • 7.4 延伸阅读
    • 习题
    • 参考文献
  • 第8章 句法分析
    • 8.1 概述
    • 8.2 短语结构句法分析
      • 8.2.1 短语结构句法树
      • 8.2.2 概率上下文无关文法
      • 8.2.3 短语结构句法分析算法
      • 8.2.4 评价指标
    • 8.3 依存结构句法分析
      • 8.3.1 依存结构句法树
      • 8.3.2 依存结构句法分析算法
      • 8.3.3 评价指标
    • 8.4 句法分析语料
      • 8.4.1 宾州大学树库
      • 8.4.2 多语言通用依存树库
      • 8.4.3 中文句法树库
    • 8.5 延伸阅读
    • 习题
    • 参考文献
  • 第9章 语义分析
    • 9.1 语义的形式化表示
      • 9.1.1 词汇语义
      • 9.1.2 事件语义
      • 9.1.3 整句语义
    • 9.2 词义消歧
    • 9.3 语义角色标注
    • 9.4 基于图表征的语义分析
      • 9.4.1 分析方法概览
      • 9.4.2 基于因子分解的语义依存分析
    • 9.5 延伸阅读
    • 习题
    • 参考文献
  • 第10章 信息抽取
    • 10.1 命名实体识别
      • 10.1.1 基本概念
      • 10.1.2 基于规则的命名实体识别
      • 10.1.3 基于统计的命名实体识别
      • 10.1.4 基于深度学习的命名实体识别
    • 10.2 实体关系抽取
      • 10.2.1 基本概念
      • 10.2.2 基于规则的实体关系抽取
      • 10.2.3 基于精标注数据的实体关系抽取
      • 10.2.4 基于远程监督数据的实体关系抽取
      • 10.2.5 基于联合训练的实体关系抽取
    • 10.3 事件抽取
      • 10.3.1 基本概念
      • 10.3.2 基于规则的事件抽取
      • 10.3.3 基于统计的事件抽取
      • 10.3.4 基于深度学习的事件抽取
    • 10.4 实体链接
      • 10.4.1 基本概念
      • 10.4.2 基于上下文的实体链接
      • 10.4.3 集体实体链接
      • 10.4.4 基于深度学习的实体链接
    • 10.5 开放域信息抽取
      • 10.5.1 开放域实体类别标签获取
      • 10.5.2 开放域关系抽取以及事件抽取
    • 10.6 延伸阅读
    • 习题
    • 参考文献
  • 第11章 篇章分析
    • 11.1 概述
      • 11.1.1 什么是篇章
      • 11.1.2 篇章分析
    • 11.2 共指消解
      • 11.2.1 共指消解的一般过程
      • 11.2.2 基于规则的方法
      • 11.2.3 基于监督学习的方法
      • 11.2.4 基于聚类的方法
      • 11.2.5 共指消解的特征
      • 11.2.6 共指消解评价
    • 11.3 话题分割
      • 11.3.1 TextTiling算法
      • 11.3.2 监督学习方法
      • 11.3.3 话题分割评价
    • 11.4 篇章关系分析
      • 11.4.1 修辞结构关系分析
      • 11.4.2 浅层篇章关系分析
      • 11.4.3 基于表示学习的方法
    • 11.5 篇章连贯性评估
      • 11.5.1 语义相关度模型
      • 11.5.2 实体网格模型
      • 11.5.3 基于表示学习的方法
    • 11.6 延伸阅读
    • 习题
    • 参考文献
  • 第12章 情感分析
    • 12.1 情感模型与情感分析相关概念
      • 12.1.1 情感模型
      • 12.1.2 情感分类相关概念
      • 12.1.3 情感信息抽取相关概念
    • 12.2 情感分类方法
      • 12.2.1 篇章级情感分类方法
      • 12.2.2 句子级情感分类
      • 12.2.3 属性级情感分类
    • 12.3 情感信息抽取方法
      • 12.3.1 评价词抽取
      • 12.3.2 属性抽取
      • 12.3.3 评价搭配的抽取
    • 12.4 延伸阅读
    • 习题
  • 第13章 文本生成
    • 13.1 概述
      • 13.1.1 文本到文本的生成
      • 13.1.2 数据到文本的生成
      • 13.1.3 视觉到文本的生成
      • 13.1.4 文本生成的评价
    • 13.2 文本摘要
      • 13.2.1 抽取式方法
      • 13.2.2 生成式方法
    • 13.3 面向数值表格的文本生成
      • 13.3.1 流水线方法
      • 13.3.2 端到端方法
    • 13.4 文本生成评价
      • 13.4.1 自动评价方法
      • 13.4.2 人工评价方法
    • 13.5 延伸阅读:视觉到文本的生成
    • 习题
    • 参考文献
  • 第14章 问答系统
    • 14.1 概述
    • 14.2 检索式问答
      • 14.2.1 问题理解技术
      • 14.2.2 段落检索技术
      • 14.2.3 答案抽取技术
      • 14.2.4 常用数据集及评价方法
    • 14.3 知识库问答
      • 14.3.1 基于语义解析的知识问答方法
      • 14.3.2 基于语义匹配的知识问答方法
      • 14.3.3 常用数据集及评价方法
    • 14.4 社区型问答
      • 14.4.1 相似问题检索
      • 14.4.2 答案摘要生成
      • 14.4.3 问题路由与专家推荐
      • 14.4.4 常用数据集及评价方法
    • 14.5 阅读理解式问答
      • 14.5.1 选择式问答
      • 14.5.2 填空式问答
      • 14.5.3 抽取式问答
      • 14.5.4 生成式问答
      • 14.5.5 常用数据集
    • 14.6 本章小结
    • 14.7 延伸阅读
    • 习题
    • 参考文献
  • 第15章 对话系统
    • 15.1 概述
    • 15.2 开放域对话系统
      • 15.2.1 基本原理
      • 15.2.2 检索式对话模型
      • 15.2.3 生成式对话模型
      • 15.2.4 常用数据集和评价方法
    • 15.3 任务型对话系统
      • 15.3.1 基本原理
      • 15.3.2 流水线式对话模型
      • 15.3.3 端到端式对话模型
      • 15.3.4 常用数据集和评价方法
    • 15.4 本章小结
    • 15.5 延伸阅读
    • 习题
    • 参考文献
  • 第16章 机器翻译
    • 16.1 引言
      • 16.1.1 机器翻译历史
      • 16.1.2 机器翻译基本方法
    • 16.2 统计机器翻译
      • 16.2.1 基于词的翻译方法
      • 16.2.2 基于短语的翻译方法
    • 16.3 基于深度学习的机器翻译
      • 16.3.1 离散表示与分布式表示
      • 16.3.2 基于编码-解码的神经机器翻译
      • 16.3.3 基于注意力机制的神经机器翻译
    • 16.4 译文质量评估与机器翻译评测
      • 16.4.1 人工评估方法
      • 16.4.2 自动评估方法
      • 16.4.3 机器翻译评测
    • 16.5 延伸阅读
    • 习题
    • 参考文献

“自然语言处理”数字课程与纸质教材一体化设计,紧密配合。数字课程包含电子教案及相关素材,拓展了教材内容。在提升课程教学效果的同时,为学生学习提供思维与探索的空间。

相关图书