摘要 | 第1-12页 |
Abstract | 第12-14页 |
第一章 绪论 | 第14-34页 |
·研究的背景和意义 | 第14-19页 |
·信息检索简史 | 第14-16页 |
·从文档检索到实体检索 | 第16-19页 |
·国内外研究现状 | 第19-30页 |
·实体检索及其分类 | 第19-21页 |
·话题相关的实体检索研究现状 | 第21-25页 |
·实体相关的实体检索研究现状 | 第25-29页 |
·实体检索中亟待解决的关键问题 | 第29-30页 |
·论文的主要研究内容、创新点和组织结构 | 第30-34页 |
·论文的主要研究内容和创新点 | 第30-32页 |
·论文的组织结构 | 第32-34页 |
第二章 基于主题模型的专家发现方法 | 第34-58页 |
·经典专家发现模型及其不足 | 第34-40页 |
·基于profile的专家发现模型 | 第35-36页 |
·基于document的专家发现模型 | 第36-38页 |
·条件独立性假设及经典专家发现模型的缺陷 | 第38-40页 |
·基于主题模型的专家发现方法 | 第40-51页 |
·主题模型概述 | 第40-42页 |
·贝叶斯网络 | 第42-47页 |
·基于主题模型的专家发现方法 | 第47-50页 |
·模型参数估计 | 第50-51页 |
·实验分析 | 第51-56页 |
·语料集与预处理 | 第51-52页 |
·评价指标 | 第52-53页 |
·实验结果与分析 | 第53-56页 |
·本章小结 | 第56-58页 |
第三章 文档与候选实体先验子模型 | 第58-84页 |
·基于Doc Rank算法的文档先验子模型 | 第58-68页 |
·文档先验子模型研究现状 | 第58-60页 |
·Page Rank算法与Doc Rank算法 | 第60-64页 |
·基于Doc Rank算法的专家发现模型 | 第64-68页 |
·基于Topic Rank算法的文档先验子模型 | 第68-78页 |
·Doc Rank算法的缺陷 | 第68页 |
·Topic Rank算法及基于Topic Rank算法的文档先验子模型 | 第68-70页 |
·实验分析 | 第70-78页 |
·以主题为中心的候选实体先验子模型 | 第78-82页 |
·以主题为中心的候选实体先验子模型 | 第78-79页 |
·实验分析 | 第79-82页 |
·本章小结 | 第82-84页 |
第四章 相关实体发现 | 第84-106页 |
·相关实体发现的概念和研究现状 | 第84-89页 |
·相关实体发现问题 | 第84-85页 |
·国内外研究现状 | 第85-89页 |
·基于主题模型的相关实体发现 | 第89-101页 |
·总体框架 | 第89-92页 |
·表格和列表中的实体识别 | 第92-98页 |
·基于文档频率的实体过滤模型 | 第98-99页 |
·基于主题模型的实体排序方法 | 第99-101页 |
·实验分析 | 第101-104页 |
·语料集和评价指标 | 第101-102页 |
·实验结果 | 第102-104页 |
·小结 | 第104-106页 |
第五章 实体名称排歧 | 第106-132页 |
·实体名称歧义性问题 | 第106-108页 |
·国内外研究现状 | 第108-112页 |
·人物姓名排歧问题 | 第108-110页 |
·人物姓名排歧方法 | 第110-112页 |
·三阶段人物姓名排歧模型 | 第112-121页 |
·三阶段人物姓名排歧模型基本思想 | 第112-114页 |
·第一阶段聚类 | 第114-118页 |
·第二阶段聚类——投票模型 | 第118页 |
·第三阶段聚类——凝聚模型 | 第118-121页 |
·实验分析 | 第121-129页 |
·语料集描述 | 第121-123页 |
·评价指标 | 第123-125页 |
·实验结果与分析 | 第125-129页 |
·小结 | 第129-132页 |
第六章 总结与展望 | 第132-136页 |
·论文工作总结 | 第132-133页 |
·论文工作展望 | 第133-136页 |
致谢 | 第136-138页 |
参考文献 | 第138-148页 |
作者在学期间取得的学术成果 | 第148-150页 |
附录A 表格分类算法源代码(JAVA版) | 第150-152页 |