首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于垂直主题搜索的交通术语相似性比对研究

摘要第1-5页
Abstract第5-9页
第一章 绪论第9-16页
   ·本文研究背景第9-10页
   ·术语相似度计算国内外研究综述第10-14页
     ·术语相似度计算研究发展阶段第10-11页
     ·术语相似度相关计算研究领域划分第11-14页
   ·本文研究目的及意义第14页
   ·本文的主要研究工作第14-16页
第二章 术语相似度计算研究总体思路及基础关键技术第16-28页
   ·相似度计算研究总体思路第16-17页
   ·基础关键技术第17-26页
     ·Heritrix 开源项目与网络爬虫程序第17-25页
     ·开源索引项目 Lucene第25-26页
   ·需要进一步的改造工作第26-27页
   ·本章小结第27-28页
第三章 基于交通主题的 Heritrix 的扩展及改进第28-35页
   ·交通主题爬虫系统工作流程第28-29页
   ·开发解析特定交通主题网站的解析器 Extractor第29-32页
     ·主题抓取的种子选择与分析第29页
     ·扩展交通信息提取类 TrafficExtractor第29-32页
   ·交通网页信息抓取测试第32-34页
   ·本章总结第34-35页
第四章 交通信息网页的解析与处理第35-44页
   ·网页信息的一般分析策略第35-39页
     ·利用正则表达式抽取工具第36-38页
     ·HTMLParser 开源库第38-39页
   ·实现交通信息网页的解析第39-43页
   ·本章总结第43-44页
第五章 构建交通信息的全文索引第44-60页
   ·全文检索及其检索系统的概念第44-46页
   ·传统检索方式的优点和不足第46页
   ·倒排索引机制第46-48页
     ·倒排索引原理第47-48页
     ·倒排的特点第48页
   ·评价信息检索系统索引的标准第48-49页
   ·基于 Lucene 的索引架构第49-52页
     ·Lucene 系统的架构第49-50页
     ·Lucene 的工作流程第50-52页
   ·交通主题信息的全文索引实现第52-58页
   ·利用 Luke 索引浏览器实现完整的查询功能第58-59页
   ·本章小结第59-60页
第六章 交通术语相似度计算第60-74页
   ·基于网络知识资源的术语相似度算法第60-65页
     ·基于检索结果摘要的相似度算法第60-62页
     ·基于检索结果命中数的相似度算法第62-65页
   ·基于交通信息垂直检索系统的 Web-PMI 算法实现第65-68页
     ·交通标准术语检索式的构造第65-67页
     ·算法结构第67-68页
   ·算法测评第68-72页
     ·实验数据选取第68-69页
     ·实验具体过程第69页
     ·实验数据分析第69-72页
   ·本章小结第72-74页
总结和展望第74-76页
参考文献第76-80页
致谢第80-81页
攻读学位期间发表的论文与参与研究项目第81页

论文共81页,点击 下载论文
上一篇:多式联运网络枢纽的定位—分配问题
下一篇:大城市出租车特许经营权管理研究