首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

机械领域文本采集和分类的研究与设计

摘要第1-4页
ABSTRACT第4-9页
1 绪论第9-15页
   ·研究背景第9-10页
     ·面向领域信息采集的背景及意义第9页
     ·文本分类背景及意义第9-10页
   ·国内外研究现状第10-13页
     ·主题爬虫研究现状第10-12页
     ·文本分类技术研究现状第12-13页
   ·论文研究内容第13-14页
   ·论文组织结构第14-15页
2 机械主题爬虫的设计第15-29页
   ·主题爬虫的体系结构第15-16页
   ·主题爬虫爬取策略的研究第16-19页
     ·广度和深度爬行策略第17页
     ·基于内容的爬行策略第17-18页
     ·基于链接的爬行策略第18-19页
   ·机械领域主题爬虫的设计第19-29页
     ·机械领域爬虫的总体设计第19-21页
     ·机械领域产品初始种子集的选择第21-22页
     ·机械主题确立第22页
     ·页面抓取第22-24页
     ·网页解析第24-25页
     ·主题相关性分析第25页
     ·程序结构第25-27页
     ·实验结果分析第27-29页
3 文本分类器的构建第29-53页
   ·文本预处理阶段的关键技术第29-33页
     ·分词和停用词处理第29-30页
     ·专业词库的建立第30-31页
     ·文本特征表示第31-33页
   ·常用的分类算法研究第33-34页
   ·领域文本分类器设计概述第34-35页
   ·朴素贝叶斯文本分类器的设计实现第35-43页
     ·类特征向量的构建第35-38页
     ·贝叶斯公式在文本分类中的应用原理第38-39页
     ·朴素贝叶斯文本分类器设计概述第39-40页
     ·朴素贝叶斯文本分类器效果分析第40-43页
   ·朴素贝叶斯文本分类器的两点改进第43-53页
     ·二次特征提取第43-49页
     ·贝叶斯加权因子的计算方法第49-51页
     ·改进后分类器效果分析第51-53页
4 原型系统设计与实现第53-59页
   ·系统设计目的第53页
   ·系统总体框架设计第53-54页
     ·系统实现爬虫原理第54页
     ·系统实现分类原理第54页
   ·系统实现第54-59页
     ·词库模块第54-55页
     ·机械爬虫模块第55-56页
     ·网页处理模块第56-57页
     ·类特征向量构建模块第57-58页
     ·文本分类模块第58-59页
5 总结与展望第59-61页
   ·总结第59页
   ·展望第59-61页
致谢第61-63页
参考文献第63-65页
硕士研究生期间的研究成果第65页
 攻读硕士学位期间发表的论文第65页
 硕士学位期间参与的科研项目第65页

论文共65页,点击 下载论文
上一篇:基于多特征融合的火焰识别方法研究
下一篇:基于Selenium的Web应用性能测试系统设计与实现