台海领域的人立方关系搜索引擎的研究与实现
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第一章 绪论 | 第10-14页 |
·选题背景及意义 | 第10-11页 |
·国内外研究现状 | 第11-12页 |
·本文主要工作 | 第12-13页 |
·本文结构 | 第13-14页 |
第二章 相关技术综述 | 第14-23页 |
·搜索引擎技术综述 | 第14-18页 |
·搜索引擎原理 | 第14-16页 |
·全文搜索引擎 | 第16页 |
·垂直搜索引擎 | 第16-17页 |
·特定领域的人立方关系搜索引擎 | 第17-18页 |
·Web信息抽取技术综述 | 第18-23页 |
·Web信息抽取概述 | 第18-19页 |
·Web信息抽取的发展历史与研究现状 | 第19-20页 |
·Web信息抽取的关键技术 | 第20-23页 |
第三章 关系搜索引擎的研究内容 | 第23-61页 |
·网络爬虫 | 第23-27页 |
·工作原理 | 第23页 |
·搜索策略 | 第23-24页 |
·主题采集策略 | 第24-25页 |
·具体解决方案 | 第25-27页 |
·网页解析 | 第27-35页 |
·相关方法 | 第27-28页 |
·HTMLParser技术 | 第28-30页 |
·时间提取 | 第30-31页 |
·正文提取 | 第31-35页 |
·网页主题过滤 | 第35-40页 |
·文本分类概述 | 第35-36页 |
·特征提取 | 第36-37页 |
·特征向量表示 | 第37页 |
·分类方法 | 第37-40页 |
·中文命名实体识别 | 第40-47页 |
·相关方法 | 第41页 |
·最大熵模型 | 第41-42页 |
·特征选择 | 第42-44页 |
·具体解决方案 | 第44-47页 |
·实体关系抽取 | 第47-54页 |
·问题提出 | 第47-49页 |
·相关方法 | 第49-50页 |
·基于特征向量的关系抽取 | 第50-54页 |
·索引/搜索模型 | 第54-61页 |
·总体模型 | 第55页 |
·Lucene技术 | 第55-58页 |
·网页搜索策略 | 第58-59页 |
·关系搜索策略 | 第59-61页 |
第四章 台海领域的人立方关系搜索引擎的设计与实现 | 第61-79页 |
·系统功能 | 第61-62页 |
·总体架构 | 第62-67页 |
·系统架构概述 | 第62-64页 |
·具体工作过程 | 第64-65页 |
·数据描述与定义 | 第65-67页 |
·系统实现 | 第67-72页 |
·开发运行环境 | 第67-68页 |
·实现技术 | 第68页 |
·系统运行状况 | 第68-72页 |
·应用和分析 | 第72-79页 |
·数据准备 | 第72-73页 |
·具体分析 | 第73-78页 |
·总结与评价 | 第78-79页 |
第五章 总结与展望 | 第79-81页 |
·论文总结 | 第79页 |
·论文展望 | 第79-81页 |
参考文献 | 第81-84页 |
致谢 | 第84-85页 |
攻读学位期间发表的学术论文目录 | 第85页 |