首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络信息采集及智能处理技术研究

摘要第1-6页
ABSTRACT第6-14页
第一章 绪论第14-19页
   ·研究背景及意义第14-15页
   ·国内外研究现状第15-17页
   ·主要研究内容第17页
   ·论文的组织结构第17-19页
第二章 Web信息采集技术研究第19-30页
   ·网络爬虫第19-23页
     ·通用爬虫原理第19-22页
     ·通用爬虫的不足第22页
     ·面向主题的聚焦爬虫第22-23页
   ·网页去重第23-25页
     ·基于聚类的方法第24页
     ·消除相同的URL第24页
     ·基于特征码的方法第24-25页
   ·信息抽取第25-27页
     ·HTML语法分析第25页
     ·信息抽取原理第25-26页
     ·基于正则表达式的信息抽取第26-27页
   ·集中式Web数据采集系统的基本结构第27-30页
第三章 文本信息处理关键技术第30-42页
   ·中文分词第30-32页
     ·分词中的难题第30页
     ·分词算法第30-32页
   ·文本的表示第32-33页
   ·文本特征选择方法第33-37页
     ·文档频度第33页
     ·信息增益第33-34页
     ·互信息第34-35页
     ·X~2(CHI)统计第35-36页
     ·基于同义词合并的特征选择第36-37页
   ·权重计算第37-38页
   ·常见分类算法第38-42页
     ·贝叶斯方法第39页
     ·决策树方法第39-40页
     ·支持向量机分类算法第40-41页
     ·K-最近邻法第41-42页
第四章 基于改进的KNN算法构造文本分类器第42-50页
   ·文本分类概述第42页
   ·改进的KNN算法第42-44页
     ·KNN算法的不足第42-43页
     ·KNN算法的改进第43-44页
   ·分类器的构造第44-48页
     ·文本分类系统结构第44-45页
     ·文本预处理第45-47页
     ·训练阶段第47页
     ·分类阶段第47-48页
   ·分类器的阈值选择第48-50页
第五章 分类实验结果与分析第50-54页
   ·实验环境第50页
   ·实验语料库第50-51页
   ·实验评估指标第51页
   ·实验设计和结果分析第51-54页
     ·特征维数对分类效果的影响第52页
     ·K值的选取对分类效果的影响第52-53页
     ·改进的KNN算法与传统KNN算法性能比较第53-54页
总结与展望第54-56页
 工作总结第54页
 工作展望第54-56页
参考文献第56-59页
攻读硕士学位期间发表的论文第59-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:混合人工蜂群算法的改进研究
下一篇:基于群智能算法的WSN路由技术研究