| 摘要 | 第1-13页 |
| ABSTRACT | 第13-17页 |
| 第一章 绪论 | 第17-37页 |
| ·研究背景和意义 | 第17-23页 |
| ·互联网应用现状 | 第17-19页 |
| ·网络舆情和实体属性信息 | 第19-22页 |
| ·面向舆情分析和属性发现的文本挖掘 | 第22-23页 |
| ·相关工作分析与挑战 | 第23-32页 |
| ·互联网文本挖掘研究现状 | 第23-29页 |
| ·网络文本挖掘的挑战 | 第29-32页 |
| ·本文工作与创新点 | 第32-36页 |
| ·研究内容 | 第32-34页 |
| ·主要创新点 | 第34-36页 |
| ·论文结构 | 第36-37页 |
| 第二章 基于消息产生速率和上下文相关度的文本会话检测 | 第37-53页 |
| ·问题描述 | 第37-39页 |
| ·相关研究 | 第39-40页 |
| ·基于消息产生速率的会话边界检测 | 第40-42页 |
| ·基于实例的上下文相关度计算方法 | 第42-44页 |
| ·在线会话抽取算法SPFC | 第44-46页 |
| ·实验验证 | 第46-52页 |
| ·实验数据 | 第46-47页 |
| ·评测方法 | 第47-48页 |
| ·实验结果 | 第48-52页 |
| ·本章小结 | 第52-53页 |
| 第三章 基于AC-Trie 的热点短语挖掘 | 第53-77页 |
| ·问题描述 | 第53-55页 |
| ·基于Trie 的朴素算法 | 第55-57页 |
| ·基于AC-Trie 的热点短语挖掘技术AC-Hot 及其实现 | 第57-70页 |
| ·AC-Trie 简介 | 第58-59页 |
| ·基于AC-Trie 的短语出现频率统计 | 第59-65页 |
| ·TopK 查找过程 | 第65-66页 |
| ·遗漏短语的出现频率分布估计 | 第66-68页 |
| ·热度度量方法的实现 | 第68-70页 |
| ·实验验证 | 第70-76页 |
| ·数据集 | 第70-71页 |
| ·参数设置 | 第71页 |
| ·实验结果 | 第71-76页 |
| ·本章小结 | 第76-77页 |
| 第四章 基于链接语义的潜属性信息发现 | 第77-99页 |
| ·垂直搜索网站上的潜属性信息 | 第77-80页 |
| ·垂直搜索应用现状 | 第80-81页 |
| ·相关研究 | 第81-82页 |
| ·垂直搜索网站上超链接的语义模型 | 第82-87页 |
| ·垂直搜索的查询及查询间的关系 | 第82-83页 |
| ·页面类型 | 第83-84页 |
| ·链接结构中的语义 | 第84-87页 |
| ·实体潜属性信息的无监督抽取技术及实现 | 第87-93页 |
| ·概述 | 第87-88页 |
| ·页面类型识别算法 | 第88-89页 |
| ·基于链接的列表页面聚类算法 | 第89-90页 |
| ·查询关系检测算法 | 第90-93页 |
| ·实验验证 | 第93-98页 |
| ·数据集 | 第93-94页 |
| ·评测方法 | 第94-95页 |
| ·实验结果 | 第95-98页 |
| ·本章小结 | 第98-99页 |
| 第五章 基于查询树的潜属性信息聚焦爬取 | 第99-123页 |
| ·引言 | 第99-103页 |
| ·相关研究 | 第103-104页 |
| ·以查询为中心的网站建模 | 第104-106页 |
| ·垂直查询 | 第104-105页 |
| ·基于查询的垂直搜索网站模型 | 第105页 |
| ·垂直搜索网站的性质 | 第105-106页 |
| ·基于查询语义模型的聚焦爬取 | 第106-116页 |
| ·实体页和列表页 | 第107页 |
| ·属性信息离线抽取技术 | 第107-108页 |
| ·属性信息聚焦爬取技术及实现 | 第108-113页 |
| ·基于URL 模式的属性搜索剪枝 | 第113-114页 |
| ·URL-Query 模式 | 第114页 |
| ·基于URL 的属性信息聚焦爬取过程剪枝 | 第114-116页 |
| ·实验验证 | 第116-122页 |
| ·通用性测试 | 第117-118页 |
| ·性能测试 | 第118-119页 |
| ·实验结果和讨论 | 第119-122页 |
| ·本章小结 | 第122-123页 |
| 第六章 基于UIMA 的文本消息流和实体信息挖掘系统 | 第123-133页 |
| ·UIMA 简介 | 第123-125页 |
| ·YHPODS 总体设计 | 第125-128页 |
| ·系统结构 | 第125-126页 |
| ·系统部署 | 第126-128页 |
| ·YHPODS 主要流程 | 第128-132页 |
| ·会话检测流程 | 第128-129页 |
| ·热点短语挖掘流程 | 第129-130页 |
| ·实体属性信息挖掘流程 | 第130-132页 |
| ·本章小结 | 第132-133页 |
| 第七章 总结与展望 | 第133-137页 |
| 致谢 | 第137-139页 |
| 参考文献 | 第139-152页 |
| 作者在学期间取得的学术成果 | 第152-154页 |
| 附录A 实体信息的隐藏现象实例 | 第154-156页 |
| 附录B 垂直搜索应用情况调查 | 第156-158页 |