顶部
收藏

web搜索


作者:
郭军
定价:
35.70元
ISBN:
978-7-04-027817-0
版面字数:
350.000千字
开本:
16开
全书页数:
294页
装帧形式:
平装
重点项目:
暂无
出版时间:
2009-08-31
读者对象:
高等教育
一级分类:
电气/电子信息/自动化类
二级分类:
电子信息/通信专业课
三级分类:
其他

本书内容包括导论、文本检索、图像检索、音频检索、信息过滤、信息推荐以及发展前沿。对Web搜索的基本概念进行定义,阐述其科学价值和研究状况,根据Web搜索所涵盖的检索、过滤以及推荐技术,论述其中的核心问题、基本概念和基本方法,并介绍Web搜索若干新的研究方向。

本书的最大特点是将Web上的信息检索、过滤和推荐等技术定义为Web搜索,使其具有比较宽泛的内涵。将Web检索、过滤和推荐统一在一个体系中,既符合这三项技术发展的现状和趋势,又便于读者进行系统的学习和研究。另外,本书紧跟近年来的最新研究进展,具有显著的先进性和独特性。

本书可以作为信息、通信、计算机类研究生或高年级本科生的教材和教学参考书,也可作为专业技术人员的阅读和培训资料。

  • 第1章 导论
    • 1.1 Web搜索的定义
    • 1.2 Web搜索的发展背景
    • 1.3 Web搜索的挑战性
    • 1.4 Web搜索的科学价值
    • 1.5 Web搜索的研究状况
    • 1.6 本书的内容
  • 第2章 文本检索
    • 2.1 引言
    • 2.2 Web信息采集
      • 2.2.1 Crawler的基本原理
      • 2.2.2 Crawler的工作效率
      • 2.2.3 Crawler的难题
    • 2.3 文本的保存与索引
      • 2.3.1 预处理
      • 2.3.2 文本的保存
      • 2.3.3 文本的索引
      • 2.3.4 索引词的选取
    • 2.4 检索模型
      • 2.4.1 Boolean模型
      • 2.4.2 VSM
      • 2.4.3 概率模型
    • 2.5 网页排序
    • 2.6 查询重构
      • 2.6.1 用户相关反馈
      • 2.6.2 自动局部分析
      • 2.6.3 自动全局分析
    • 2.7 文本聚类
      • 2.7.1 区分法
      • 2.7.2 生成法
    • 2.8 文本分类
      • 2.8.1 k-NN分类器
      • 2.8.2 Bayes分类器
      • 2.8.3 最大熵分类器
      • 2.8.4 区分式分类器
    • 2.9 特征选择
      • 2.9.1 包含算法
      • 2.9.2 排除算法
    • 2.10 特征变换
      • 2.10.1 自组织映射
      • 2.10.2 潜语义标号
    • 小结
    • 习题
  • 第3章 图像检索
    • 3.1 引言
    • 3.2 图像检索的发展过程
    • 3.3 文本自动标注
      • 3.3.1 基于二维多粒度隐Markov模型的二类标注
      • 3.3.2 有监督的多类标注SML
    • 3.4 物体识别
      • 3.4.1 星群模型
      • 3.4.2 异构星状模型
    • 3.5 文字识别
      • 3.5.1 引言
      • 3.5.2 离线文字识别系统
      • 3.5.3 非线性归一化
      • 3.5.4 余弦整形变换
      • 3.5.5 方向线素特征抽取
      • 3.5.6 渐进式计算的马氏距离分类器
      • 3.5.7 基于模具的文字切分
    • 3.6 人脸检测与识别
      • 3.6.1 Adaboost人脸检测算法
      • 3.6.2 常见的人脸识别算法
      • 3.6.3 非限定性人脸识别算法
    • 3.7 视频检索
      • 3.7.1 概述
      • 3.7.2 镜头切分
      • 3.7.3 视频摘要
    • 小结
    • 习题
  • 第4章 音频检索
    • 4.1 引言
    • 4.2 声学特征抽取
      • 4.2.1 时域特征抽取
      • 4.2.2 频域特征抽取
    • 4.3 HMM模型
      • 4.3.1 基本概念与原理
      • 4.3.2 3个基本问题及其经典算法
    • 4.4 连续语音识别系统
      • 4.4.1 基于HMM的语音识别统一框架
      • 4.4.2 声学模型
      • 4.4.3 语言模型
      • 4.4.4 解码器
    • 4.5 语音关键词发现技术
      • 4.5.1 基于垃圾模型的关键词发现
      • 4.5.2 语音关键词发现中的核心问题
      • 4.5.3 一个侧重确认的语音关键词发现系统
    • 4.6 语音词汇检测技术
      • 4.6.1 混淆网络
      • 4.6.2 一个基于音节混淆网络的STD系统
    • 4.7 非语音音频检索
      • 4.7.1 概述
      • 4.7.2 声学模型
      • 4.7.3 语义模型
      • 4.7.4 声学空间与语义空间的联系
    • 4.8 音乐检索
      • 4.8.1 概述
      • 4.8.2 哼唱检索
      • 4.8.3 基于语义描述的音乐标注及检索
    • 小结
    • 习题
  • 第5章 信息过滤
    • 5.1 引言
    • 5.2 基本方法
      • 5.2.1 基于Bayes分类器的过滤
      • 5.2.2 基于向量距离分类器的过滤
      • 5.2.3 基于k近邻分类器的过滤
      • 5.2.4 基于SVM的过滤
      • 5.2.5 系统性能评价
    • 5.3 模型学习
      • 5.3.1 生成式与区分式学习
      • 5.3.2 降维变换
      • 5.3.3 半监督学习
      • 5.3.4 演进式学习
    • 5.4 垃圾邮件及垃圾短信过滤
      • 5.4.1 垃圾邮件过滤系统
      • 5.4.2 垃圾短信的过滤
    • 5.5 话题检测与跟踪系统
      • 5.5.1 报道分割
      • 5.5.2 事件检测
      • 5.5.3 事件跟踪
    • 小结
    • 习题
  • 第6章 信息推荐
    • 6.1 引言
    • 6.2 关联规则挖掘的基本算法
      • 6.2.1 基本定义
      • 6.2.2 Apriori关联规则挖掘算法
      • 6.2.3 基于FPT的算法
    • 6.3 可信关联规则及其挖掘算法
      • 6.3.1 相关定义
      • 6.3.2 用邻接矩阵求2项可信集
      • 6.3.3 由k项可信集生成(k+1)项可信集
      • 6.3.4 基于极大团的可信关联规则挖掘算法
    • 6.4 基于FPT的超团模式快速挖掘算法
      • 6.4.1 相关定义
      • 6.4.2 基于FPT的超团模式和极大超团模式挖掘
    • 6.5 协同过滤推荐的基本算法
    • 6.6 基于局部偏好的协同过滤推荐算法
    • 6.7 基于个性化主动学习的协同过滤
    • 6.8 面向排序的协同过滤
    • 小结
    • 习题
  • 第7章 发展前沿
    • 7.1 内网检索及对象检索
    • 7.2 基于文档的专家检索
      • 7.2.1 基于文档的专家表示
      • 7.2.2 基于文档的专家检索
    • 7.3 对象检索及信息抽取
      • 7.3.1 对象检索的基本概念
      • 7.3.2 信息抽取
    • 7.4 基于Web的对象检索
    • 7.5 博客检索
    • 7.6 TREC中的博客观点检索
    • 7.7 文本情感分析
      • 7.7.1 文本情感分析中的特征抽取
      • 7.7.2 情感分类模型
    • 小结
    • 习题
  • 参考文献

相关图书