基于网络的专家信息库自动构建技术研究
摘要 | 第1-7页 |
Abstract | 第7-11页 |
第1章 绪论 | 第11-15页 |
·课题研究背景及意义 | 第11-12页 |
·国内外研究现状 | 第12-14页 |
·专家信息库 | 第12-13页 |
·Web 信息抽取 | 第13-14页 |
·研究内容及论文结构安排 | 第14-15页 |
第2章 WEB 信息抽取概述 | 第15-21页 |
·WEB 信息抽取概念 | 第15页 |
·WEB 信息抽取关键技术 | 第15-16页 |
·HTML | 第15页 |
·XML | 第15-16页 |
·网页分块 | 第16页 |
·WEB 信息抽取的方式 | 第16-20页 |
·基于自然语言处理的 Web 信息抽取 | 第16-17页 |
·基于包装器归纳的信息抽取 | 第17-18页 |
·基于本体的信息抽取 | 第18页 |
·基于 HTML 结构的信息抽取 | 第18-19页 |
·基于 Web 查询的信息抽取 | 第19页 |
·各方法的比较 | 第19-20页 |
·小结 | 第20-21页 |
第3章 基于规则的专家个人信息抽取 | 第21-32页 |
·专家个人信息抽取 | 第21-24页 |
·概述 | 第21-23页 |
·相关研究 | 第23页 |
·专家个人信息抽取框架 | 第23-24页 |
·网页获取及预处理 | 第24-25页 |
·基于固定站点的网页获取 | 第24页 |
·基于关键词搜索的网页获取 | 第24页 |
·网页预处理 | 第24-25页 |
·抽取规则建立 | 第25-29页 |
·引导词库的建立 | 第25-26页 |
·抽取规则库的建立 | 第26-29页 |
·实验 | 第29-31页 |
·测试集的建立 | 第29页 |
·评价指标 | 第29-30页 |
·实验结果 | 第30页 |
·错误分析 | 第30-31页 |
·小结 | 第31-32页 |
第4章 基于系统融合的专家同名区分方法 | 第32-42页 |
·引言 | 第32页 |
·同名区分相关研究 | 第32-35页 |
·有监督的同名区分方法 | 第32-33页 |
·半监督的同名区分方法 | 第33页 |
·无监督的同名区分方法 | 第33-34页 |
·基于社会关系网络的同名区分方法 | 第34-35页 |
·基于系统融合的专家同名区分方法概述 | 第35页 |
·重名论文的相似度计算方法 | 第35-37页 |
·基于论文合作者关系的论文相似度计算 | 第35-36页 |
·基于内容的相似度计算 | 第36-37页 |
·基于系统融合的层次聚类方法 | 第37-39页 |
·层次聚类 | 第37页 |
·系统融合 | 第37-39页 |
·实验 | 第39-41页 |
·实验测试数据集的构建 | 第39页 |
·评价指标 | 第39-40页 |
·实验结果与分析 | 第40-41页 |
·小结 | 第41-42页 |
第5章 基于网络的专家个人信息自动采集系统 | 第42-47页 |
·数据来源 | 第42页 |
·系统架构设计 | 第42-43页 |
·网页获取模块 | 第42-43页 |
·网页预处理模块 | 第43页 |
·信息抽取模块 | 第43页 |
·后处理模块 | 第43页 |
·信息存储模块 | 第43页 |
·数据库设计 | 第43-44页 |
·系统演示实例 | 第44-46页 |
·小结 | 第46-47页 |
结论 | 第47-49页 |
全文的主要工作及得到的主要结论总结 | 第47页 |
对今后工作的建议 | 第47-49页 |
参考文献 | 第49-52页 |
致谢 | 第52-54页 |
攻读硕士期间发表(含录用)的学术论文 | 第54页 |