首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

开放式文档同构引擎关键技术研究与实现

摘要第1-7页
ABSTRACT第7-11页
第一章 绪论第11-19页
   ·开放式文档同构引擎研究背景第11-12页
   ·开放式文档同构引擎应用第12-14页
     ·文档摘要系统中的应用第12-13页
     ·反垃圾邮件系统中的应用第13-14页
   ·开放式文档同构引擎概述第14-16页
     ·物理结构层第15页
     ·逻辑结构层第15页
     ·词句法分析层第15-16页
     ·概念抽取层第16页
     ·主题表示层第16页
   ·国内外研究现状第16-17页
   ·主要工作和本文组织结构第17-19页
第二章 物理层结构分析第19-27页
   ·字符编码和识别技术简介第20-22页
     ·英文字符与汉字字符的识别第21页
     ·GB码与BIG5 码的识别第21-22页
   ·物理结构层格式定义第22-23页
   ·异构文档的接口实现第23-27页
     ·HTML文档物理接口实现第23-24页
     ·PDF文档物理接口实现第24-27页
第三章 逻辑结构分析第27-36页
   ·文档逻辑结构的定义第27-29页
   ·文档逻辑结构的分析过程第29-36页
     ·预处理第30-31页
     ·除噪第31页
     ·特征识别第31-32页
     ·小标题识别第32-33页
     ·逻辑结构树生成第33-36页
第四章 词句法分析层之词法分析系统第36-53页
   ·分词算法第37-41页
     ·基于词典的分词技术第37-40页
     ·基于统计的分词技术第40-41页
     ·混合型分词技术第41页
   ·词性标注第41-43页
     ·基于规则的方法第41-42页
     ·基于统计的方法第42-43页
   ·高效的倒排索引存储结构第43-49页
     ·相关定义第45-47页
     ·倒排索引管理第47-49页
     ·结论第49页
   ·新词识别技术第49-53页
     ·新词定义第49-50页
     ·篇章内串频计算方法第50-51页
     ·网络间字串频度统计第51页
     ·字结构组合规则第51页
     ·加权处理第51页
     ·垃圾串处理第51-52页
     ·结果及论述第52-53页
第五章 词句法分析层之句法分析系统第53-74页
   ·句法分析研究背景第53-59页
     ·乔姆斯基语法体系第55-56页
     ·HPSG和LFG第56-57页
     ·依存语法第57-58页
     ·链语法第58-59页
   ·句法分析系统关键技术第59-71页
     ·CHART算法第61-65页
     ·PCFG消歧第65-70页
     ·平滑技术第70-71页
   ·句法分析系统测评第71-74页
     ·PARSEVAL评测第71-72页
     ·树形相似评价标准第72-74页
第六章 概念抽取及主题表示层技术分析第74-86页
   ·概念抽取层关键技术第74-81页
     ·预处理第75-77页
     ·形成高频串第77-79页
     ·后处理第79-81页
   ·主题表示层关键技术第81-84页
     ·向量空间模型第81-82页
     ·降维第82-83页
     ·权值计算第83-84页
   ·实验结果第84-86页
第七章 总结和展望第86-88页
参考文献第88-91页
致谢第91-92页
攻读硕士学位期间已发表或录用的论文第92-93页
攻读硕士学位期间参加的科研项目第93页

论文共93页,点击 下载论文
上一篇:AES算法在移动存储加密系统中的硬件设计
下一篇:基于混沌映射的Hash函数在RFID安全协议中的应用