首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

网页特征词典生成模型的设计与实现

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-14页
   ·研究背景与意义第10-11页
   ·网页分类技术的发展现状第11-12页
   ·论文结构与主要工作第12-13页
   ·本章小结第13-14页
第二章 相关技术与研究工作综述第14-36页
   ·网页分类技术综述第14-18页
     ·网页自动分类流程第14-15页
     ·典型分类算法第15-18页
   ·网络爬虫技术综述第18-24页
     ·爬虫方法第18-20页
     ·爬行策略第20-24页
   ·中文分词技术综述第24-29页
     ·中文分词常用方法第24-27页
     ·歧义第27页
     ·未登录词与停用词第27-28页
     ·常用中文分词开源项目第28-29页
   ·相关工具介绍第29-32页
     ·Nutch第29-30页
     ·Lucene第30-32页
     ·Luke第32页
   ·网络爬虫和中文分词技术研究现状第32-35页
   ·本章小结第35-36页
第三章 网页特征词典生成模型的分析与概要设计第36-44页
   ·模型的整体分析第36-37页
   ·爬虫模块的分析与概要设计第37-41页
     ·URL管理子模块第37-38页
     ·页面爬取子模块第38-40页
     ·信息过滤子模块第40-41页
   ·分词模块的分析与概要设计第41-43页
     ·分词前处理子模块第41页
     ·中文分词子模块第41-42页
     ·特征词计算子模块第42-43页
   ·本章小结第43-44页
第四章 网页特征词典生成模型的详细设计与实现第44-57页
   ·爬虫模块的详细设计与实现第44-49页
     ·URL管理子模块第45-46页
     ·页面爬取子模块第46-48页
     ·信息过滤子模块第48-49页
   ·分词模块的详细设计与实现第49-56页
     ·分词前处理子模块第50-52页
     ·中文分词子模块第52-54页
     ·特征词计算子模块第54-56页
   ·本章小结第56-57页
第五章 网页特征词典生成模型的测试第57-63页
   ·生成汽车类别网页特征词典第57-59页
   ·测试汽车类别网页特征词典第59-61页
   ·结果分析第61-62页
   ·本章小结第62-63页
第六章 总结及展望第63-64页
   ·总结第63页
   ·展望第63-64页
参考文献第64-67页
致谢第67-68页
攻读硕士学位期间发表的学术论文第68页

论文共68页,点击 下载论文
上一篇:面向稀疏性数据的协同过滤推荐算法的研究与实现
下一篇:移动互联网统一计费平台的设计与实现