首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的中文文本分类的研究与实现

1 绪论第1-12页
   ·本论文的研究背景第8-10页
     ·数据挖掘介绍第8页
     ·WEB 挖掘的定义第8-9页
     ·WEB 文本挖掘第9-10页
     ·WEB 文本分类第10页
   ·论文的组织安排第10-12页
2 系统功能分析和结构框架第12-15页
   ·系统功能概述第12页
   ·系统结构框架第12-13页
   ·系统设计第13-14页
   ·软硬件环境第14-15页
3 WEB 文本收集和预处理第15-25页
   ·WEB 文本收集第15-21页
     ·WEB 文本收集器工作原理第15-16页
     ·WEB 文本收集器设计第16页
     ·WEB 文本收集器实现第16-18页
     ·WEB 文本收集器特点第18-21页
   ·WEB 文本预处理第21-24页
     ·HTML 标记权重第21-22页
     ·WEB 文本预处理器设计第22页
     ·WEB 文本预处理器实现第22-24页
   ·本章小结第24-25页
4 WEB 文本挖掘中的中文分词第25-39页
   ·WEB 中文分词器设计第25-27页
   ·中文分词算法介绍第27-32页
     ·常用中文分词算法第27-28页
     ·分词技术的难点第28-30页
     ·当前重要的基于词典分词算法第30-32页
     ·几种分词算法的比较第32页
   ·改进的全二分最大匹配快速分词算法第32-36页
     ·汉字编码体系第33页
     ·汉语词的特点第33页
     ·分词词典第33-35页
     ·词条查找算法第35-36页
   ·WEB 中文分词器实现第36-38页
   ·WEB 中文分词器分词结果统计第38页
   ·本章小结第38-39页
5 文本特征向量提取第39-47页
   ·向量空间模型第39-42页
     ·向量空间模型描述第39-41页
     ·向量空间模型存在问题第41页
     ·加权的VSM 算法改进第41-42页
   ·文本特征向量建立过程第42-45页
     ·文本特征项的选择第42-44页
     ·文本特征向量的权重第44-45页
   ·文本特征向量提取实现第45-46页
   ·本章小结第46-47页
6 文本训练与文本分类第47-61页
   ·支持向量机第47-53页
     ·线性支持向量机第48-50页
     ·非线性支持向量机第50-52页
     ·支持向量机和结构风险最小化原则第52-53页
   ·SVM 方法在文本分类中的应用第53-55页
   ·LIBSVM 介绍第55-58页
     ·LIBSVM 使用方法第55-56页
     ·LIBSVM 数据格式第56页
     ·svmtrain 和svmpredict 的用法第56-58页
   ·文本训练第58-59页
   ·文本分类第59-60页
   ·本章小节第60-61页
7 总结第61-62页
致谢第62-63页
参考文献第63-65页
攻读硕士学位期间发表的论文第65页

论文共65页,点击 下载论文
上一篇:ΣΔAD转换器改进及后端设计
下一篇:人工髓核柔性稳定一体化系统治疗颈椎间盘病变的研究