首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于机器学习的中文文本自动分类的研究和应用

摘要第1-4页
Abstract第4-8页
第1章 引言第8-13页
   ·研究的意义第8页
   ·国内外的研究现状第8-9页
   ·本课题研究的主要内容第9-11页
     ·中文WEB文本的自动抓取第9-10页
     ·中文WEB文本的预处理第10页
     ·中文文本的自动分类器第10-11页
   ·本课题的创新点第11页
   ·本文的结构第11-13页
第2章 总体设计第13-16页
   ·功能模块第13-14页
     ·网络蜘蛛第13-14页
     ·中文分词第14页
     ·特征选取第14页
     ·贝叶斯机器学习及分类第14页
   ·开发平台的选择第14-16页
第3章 网络蜘蛛第16-31页
   ·网络蜘蛛的遍历策略第16-17页
   ·Robots协议第17-18页
   ·WEB文本的信息提取第18-20页
   ·HTML结构化解析第20-29页
     ·HTML中的超链接第20页
     ·HTML解析第20-29页
   ·网络蜘蛛的实现第29-31页
第4章 中文WEB文本的预处理第31-40页
   ·文本内容过滤第31-32页
   ·中文分词第32-37页
     ·简单扫描匹配法第33-34页
     ·扫描及条件决择法第34-35页
     ·复杂人工智能方法第35-37页
   ·中文分词的实现第37-40页
     ·中文词典第37-39页
     ·中文词条切分第39-40页
第5章 特征选取第40-44页
   ·特征选取算法第40-42页
     ·文本频度法第40-41页
     ·相关信息量法第41页
     ·x~2统计法第41-42页
     ·词条频度法第42页
   ·特征选取算法的比较与改进第42-44页
第6章 基于贝叶斯学习的文本分类器的实现第44-48页
   ·贝叶斯方法与文本分类第44-45页
   ·Naive贝叶斯分类方法第45-46页
     ·Naive贝叶斯分类方法第45-46页
     ·估计概率第46页
   ·Naive贝叶斯文本分类器算法第46-48页
第7章 实验与测试分析第48-53页
   ·实验运行效果与分析第48-51页
   ·文本分类的实验结果与分析第51-53页
第8章 结论第53-55页
   ·中文文本分类小结第53页
   ·进一步研究的设想第53-55页
参考文献第55-58页
致谢第58-59页
攻读硕士学位期间发表论文情况第59页

论文共59页,点击 下载论文
上一篇:移民集中安置区移民贫困的研究--对全国最大移民集中安置镇柴湖镇的调查
下一篇:我国上市公司管理层收购财务绩效的实证研究