首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

Web文本分类系统中文本预处理技术的研究与实现

摘要第1-4页
Abstract第4-7页
1 绪论第7-13页
   ·研究背景及意义第7-8页
   ·搜索引擎的发展第8-9页
   ·Web文本分类的研究现状第9-11页
   ·本文的主要研究内容第11-12页
   ·本文的组织结构第12-13页
2 Web文本挖掘第13-23页
   ·Web文本挖掘的特点第13-14页
   ·Web文本分类系统第14-16页
   ·常用的文本分类算法第16-23页
     ·KNN分类算法第16页
     ·朴素贝叶斯算法第16-17页
     ·决策树算法第17-18页
     ·SVM分类算法第18-23页
3 Web文本预处理技术第23-41页
   ·DOM树结构第23-25页
   ·网页清洗第25-28页
   ·中文分词第28-31页
     ·机械分词法第28-29页
     ·基于理解的分词方法第29页
     ·基于统计的分词方法第29-31页
   ·去除停用词第31-32页
   ·常用的特征选择方法第32-34页
     ·文档频度第32页
     ·信息增益第32页
     ·互信息第32-33页
     ·x~2统计第33-34页
   ·基于同义词统计的特征选择第34-38页
     ·《同义词词林》扩展版介绍第34-36页
     ·基于《同义词词林》的特征选择方法第36-38页
   ·文档的表示第38-41页
     ·文档的向量表示第38页
     ·特征项权重的计算第38-41页
4 支持向量机在Web文本分类中的应用第41-44页
   ·LIBSVM分类器介绍第41页
   ·支持向量机在文本分类中的应用第41-42页
   ·SVM用于Web文本挖掘中的优点第42-44页
5 预处理系统实现及实验结果分析第44-57页
   ·预处理系统设计第44-52页
     ·网页清洗模块第44-47页
     ·分词模块第47-48页
     ·特征选择模块第48-51页
     ·文本表示模块第51-52页
   ·试验环境及采用的语料第52页
   ·试验结果分析第52-57页
     ·采用的分类评价指标第52-53页
     ·试验结果第53-57页
6 结束语第57-59页
   ·本文小结第57页
   ·进一步的工作第57-59页
致谢第59-60页
参考文献第60-62页

论文共62页,点击 下载论文
上一篇:结合模糊理论的视觉识别与跟踪技术研究
下一篇:基于容积特征的人体动作检测