基于检索词扩展和文本表示的文库搜索引擎
摘要 | 第4-5页 |
abstracts | 第5页 |
第一章 绪论 | 第8-20页 |
1.1 课题的研究目的及意义 | 第8页 |
1.2 国内外发展现状 | 第8-16页 |
1.2.1 通用搜索引擎发展现状 | 第8-9页 |
1.2.2 垂直搜索引擎发展现状 | 第9-10页 |
1.2.3 语义Web研究现状 | 第10-16页 |
1.3 本文的主要研究内容 | 第16-20页 |
1.3.1 本文完成的工作 | 第16-17页 |
1.3.2 本文选用的相关基础框架 | 第17-18页 |
1.3.3 本文章节安排 | 第18-20页 |
第二章 知识本体自动化抽取及构建 | 第20-33页 |
2.1 本体自动化构建技术架构 | 第20-21页 |
2.2 本体库的构建 | 第21-29页 |
2.2.1 信息抽取任务描述 | 第21-22页 |
2.2.2 基于爬虫的信息抽取 | 第22-26页 |
2.2.3 本体形式化编码 | 第26-29页 |
2.3 基于Jena的本体存储及查询 | 第29-31页 |
2.3.1 本体存储 | 第29页 |
2.3.2 推理器与规则定义 | 第29-30页 |
2.3.3 SPARQL查询 | 第30-31页 |
2.4 知识本体在本文的应用思路 | 第31-32页 |
2.5 本章小结 | 第32-33页 |
第三章 基于词嵌入的语义相似性计算研究 | 第33-43页 |
3.1 分布式表示 | 第33-36页 |
3.1.1 词向量模型介绍 | 第33-34页 |
3.1.2 Word2vec算法思想 | 第34-36页 |
3.2 词向量训练 | 第36-37页 |
3.3 词向量结果分析 | 第37-39页 |
3.3.1 词语相似度计算 | 第37-38页 |
3.3.2 潜在语言学规律分析 | 第38-39页 |
3.4 词向量应用 | 第39-42页 |
3.4.1 Word2vec应用场景 | 第39-40页 |
3.4.2 word2vec在本文应用 | 第40-42页 |
3.5 本章小结 | 第42-43页 |
第四章 搜索引擎设计实现及应用 | 第43-59页 |
4.1 搜索引擎设计与实现 | 第43-49页 |
4.1.1 功能描述 | 第43-44页 |
4.1.2 系统流程 | 第44-45页 |
4.1.3 检索词扩展 | 第45-46页 |
4.1.4 文档权重策略 | 第46-47页 |
4.1.5 评分算法定制 | 第47-49页 |
4.2 平台核心业务模块设计与实现 | 第49-54页 |
4.2.1 技术架构 | 第50-51页 |
4.2.2 业务架构 | 第51-53页 |
4.2.3 安全设计 | 第53页 |
4.2.4 API设计 | 第53-54页 |
4.3 系统测试与检索结果评价 | 第54-58页 |
4.3.1 测试目标 | 第54-55页 |
4.3.2 测试环境 | 第55页 |
4.3.3 功能测试 | 第55-56页 |
4.3.4 检索结果评价 | 第56-58页 |
4.4 本章小结 | 第58-59页 |
第五章 总结及展望 | 第59-61页 |
5.1 总结 | 第59页 |
5.2 展望 | 第59-61页 |
参考文献 | 第61-64页 |
攻读学位期间获得的研究成果 | 第64-65页 |
致谢 | 第65页 |