首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web中文信息获取的算法研究

摘要第1-6页
ABSTRACT第6-7页
第一章 绪论第7-15页
   ·问题的提出第7-8页
   ·相关研究综述第8-13页
     ·Web信息检索系统第8-9页
     ·搜索引擎的类型及研究动向第9-12页
     ·Web信息抽取技术第12-13页
   ·本文研究内容第13-14页
   ·本文结构第14-15页
第二章 WEB搜索引擎研究第15-26页
   ·搜索引擎系统的组成及工作原理第15-21页
     ·搜索器第17-19页
     ·索引器第19-20页
     ·检索器第20-21页
     ·用户接口第21页
   ·WEB搜索引擎相关技术第21-26页
     ·网页信息采集技术第21-22页
     ·汉语自动分词第22页
     ·检索结果排序算法第22-23页
     ·自动分类技术第23-24页
     ·智能代理(Intelligent Agent)技术第24-26页
第三章 中文自动分词算法的研究第26-42页
   ·词典设计第26-33页
     ·典型的中文分词词典机制第26-31页
     ·字典结构设计第31-32页
     ·字典查询过程第32-33页
   ·自动分词算法第33-38页
     ·基于字符串匹配的分词算法第33-37页
     ·基于统计语言模型的分词算法第37页
     ·基于理解的分词算法第37-38页
   ·基于最大匹配的概率算法第38-40页
     ·基于最大匹配的概率算法第38-39页
     ·歧义词的消去第39-40页
   ·算法分析第40-42页
     ·空间第40页
     ·性能分析第40-41页
     ·实验与分析第41-42页
第四章 WEB页面主题相关性排序算法的研究第42-52页
   ·网页排序算法第42-46页
     ·PageRank算法第43-44页
     ·ARC算法第44页
     ·HITS算法第44-46页
   ·WEB页面主题的相关性分析第46-48页
     ·Web页面主题特性分析第46-47页
     ·页面主题的相关性分析第47-48页
   ·网页的相关性计算算法第48-50页
     ·基于URL的相关性计算第48页
     ·基于网页标记的相关性计算第48-49页
     ·网页文本的相关性计算第49页
     ·用户行为的相关性计算第49页
     ·相关性计算算法第49-50页
   ·实验与分析第50-52页
第五章 WEB中文信息获取的框架第52-70页
   ·WEB信息抽取第52-60页
     ·Web信息抽取概述第52-54页
     ·Web信息抽取技术第54-60页
   ·基于XML信息抽取的相关技术第60-66页
     ·XML介绍第60-61页
     ·DOM模型第61-63页
     ·XPath第63-66页
   ·基于XML的信息抽取模型第66-70页
     ·信息采集第67页
     ·文本预处理第67-68页
     ·信息抽取第68-69页
     ·索引库第69页
     ·用户查询模块第69-70页
第六章 结论第70-71页
   ·本文小结第70页
   ·工作展望第70-71页
参考文献第71-74页
致谢第74-75页
攻读学位期间的科研任务和发表的论文第75页

论文共75页,点击 下载论文
上一篇:E-learning环境中个性化推荐系统研究
下一篇:基于社会性软件的非正式学习环境模型构建研究