Web人名消歧方法的研究与实现

中文摘要	第1-5页
Abstract	第5-9页
第1章序言	第9-13页
·课题背景与意义	第9-10页
·研究现状	第10-11页
·课题的主要研究内容	第11-12页
·本文结构	第12-13页
第2章人名消歧的相关知识	第13-25页
·人名消歧概述	第13-14页
·人名消歧的难点	第14-15页
·人名消歧中的关键技术	第15-23页
·文本表示模型	第15-17页
·空间降维	第17-20页
·特征提取	第17-19页
·特征重构	第19-20页
·文本相似度计算	第20-21页
·聚类方法	第21-23页
·聚类分析的定义	第21-22页
·聚类算法的分类	第22-23页
·人名消歧系统框架	第23-24页
·本章小结	第24-25页
第3章网页正文提取技术研究	第25-34页
·网页的结构分析	第26-27页
·基于CSS 的网页正文内容提取技术	第27-31页
·CSS 盒式模型	第27-28页
·算法流程	第28-29页
·过滤算法	第29页
·剪枝算法	第29-30页
·CSS 分析器及分块器	第30-31页
·语义分析器	第31页
·实验结果及分析	第31-33页
·本章小结	第33-34页
第4章基于LDA 和上下文聚类的Web 人名消歧方法	第34-50页
·LDA 模型介绍	第34-37页
·预定义	第35页
·LDA 算法的数学构成	第35-37页
·Gibbs 抽样参数估计	第37-38页
·常用聚类算法研究	第38-40页
·K-means 方法	第38-39页
·层次聚类方法	第39-40页
·AP 聚类	第40页
·K-Means 算法缺点	第40-41页
·基于最大最小原则的改进的K-Means 算法	第41-43页
·算法流程	第43-44页
·基于主题模型的文本初步划分	第44页
·基于名字上下文片段的人物个体判别	第44-45页
·实验结果及分析	第45-49页
·实验设计	第45-46页
·实验分析	第46-49页
·实验语料库	第46-47页
·评测方法	第47页
·实验结果及分析	第47-49页
·本章小结	第49-50页
第5章总结和展望	第50-52页
·本文总结	第50页
·未来工作	第50-52页
参考文献	第52-56页
攻读硕士学位期间公开发表的论文	第56-57页
致谢	第57-58页