首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络文本分类技术研究

摘要第1-5页
Abstract第5-6页
目录第6-9页
1 引言第9-16页
   ·研究背景和意义第9-10页
     ·研究背景第9页
     ·网络文本分类意义第9-10页
   ·文本分类技术的研究现状第10-13页
     ·国外研究状况第10-11页
     ·国内研究状况第11-12页
     ·网络文本分类研究现状第12-13页
   ·课题研究难点及突出问题第13-15页
   ·论文组织结构第15-16页
2 网络文本提取技术第16-19页
   ·HTML语言介绍第16-17页
   ·网页内容提取的方法第17-18页
     ·基于模板的网页内容提取法第17-18页
     ·基于统计的网页内容提取法第18页
     ·基于视觉的网页正文提取法第18页
   ·本章小结第18-19页
3 网络文本分类关键技术第19-32页
   ·网络文本预处理第20页
   ·中文分词技术第20-23页
     ·中文分词的问题及难点第21-22页
     ·中文分词的主要方法第22-23页
   ·文本表示第23-26页
   ·权重计算第26-27页
   ·特征提取第27-29页
   ·常见文本分类算法第29-31页
     ·贝叶斯分类方法第29-30页
     ·决策树分类方法第30页
     ·基于距离的分类方法第30页
     ·其他分类方法第30-31页
   ·本章小结第31-32页
4 网络文本内容提取及文本预处理的实现第32-43页
   ·网页文本内容提取第32-35页
     ·网页文本内容提取的实现第32-33页
     ·网页内容提取主要主要步骤及流程第33-34页
     ·网页内容提取主要函数第34-35页
   ·中文分词实现第35-39页
     ·词库索引的建立第36-37页
     ·分词的主要步骤第37-38页
     ·去除停用词第38-39页
   ·文本表示第39-41页
   ·特征提取第41-42页
   ·本章小结第42-43页
5 文本分类的实现第43-55页
   ·KNN分类第44-46页
     ·KNN分类算法第44-45页
     ·KNN分类的实现第45-46页
   ·贝叶斯分类第46-50页
     ·朴素贝叶斯模型第46-47页
     ·贝叶斯公式介绍第47页
     ·贝叶斯分类算法第47-49页
     ·贝叶斯分类算法实现第49-50页
   ·贝叶斯分类算法问题分析及改进第50-52页
     ·基于TAN结构的贝叶斯分类方法第50-51页
     ·TAN结构的贝叶斯方法实现第51-52页
   ·文本情感分类第52-54页
     ·文本情感概念的组成第52-53页
     ·文本情感特征提取及分类实现第53-54页
   ·本章小结第54-55页
6 网络文本分类系统的评估及实验结果第55-60页
   ·分类器评估指标第55-56页
     ·查准率和查全率第55-56页
     ·F测试值第56页
     ·精确率和错误率第56页
   ·分类测试实验结果第56-59页
   ·本章小结第59-60页
7 总结和展望第60-62页
   ·总结第60页
   ·展望第60-62页
参考文献第62-65页
在学期间研究成果第65-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:二维条码识别中关键技术的研究
下一篇:Web环境下电子商务数据集成技术研究