首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

改进空间向量模型及其在文档自动分类系统中的应用

摘要第1-7页
ABSTRACT第7-11页
第1章 绪论第11-18页
   ·论文研究的背景及意义第11-12页
   ·国内外研究发展现状第12-13页
   ·文档自动分类在信息处理中的应用第13-15页
     ·搜索引擎第13-14页
     ·邮件分类第14页
     ·信息过滤第14页
     ·主动推送服务第14-15页
   ·文档自动分类系统架构第15-16页
     ·系统框架第15-16页
     ·文档预处理第16页
     ·特征选取第16页
     ·文档训练及分类测试第16页
   ·本论文的主要工作第16-17页
   ·论文安排与主要研究工作第17-18页
第2章 文档自动分类系统与关键技术分析第18-38页
   ·文档预处理第18-19页
     ·文本预处理过程实现第18-19页
   ·文档特征提取第19-25页
     ·文档频率第21-22页
     ·互信息MI第22-23页
     ·信息增益IG第23-24页
     ·x~2统计法第24页
     ·词条强度法第24-25页
   ·文档分类模型第25-30页
     ·经典的分类方法第25-28页
     ·向量空间模型第28-30页
   ·文档中英文分词第30-38页
     ·简单扫描匹配法第31-33页
     ·扫描及条件决策法第33-34页
     ·复杂人工智能方法第34-38页
第3章 基于概率统计和查找树的中文分词算法第38-48页
   ·现阶段中文分词存在的问题第38页
   ·基于概率统计和查找树的中文分词算法第38-47页
     ·问题的提出第38-39页
     ·概率统计模型第39-45页
     ·查找树第45-47页
   ·本章小结第47-48页
第4章 基于段落和词距向量的空间向量模型第48-57页
   ·传统向量空间模型存在的问题第48页
   ·文档的预处理第48-49页
   ·基于段落向量和词距向量的特征提取算法第49-56页
     ·段落在表达文档上的重要作用第49-50页
     ·段落向量和词距向量第50-52页
     ·特征提取示例第52-54页
     ·特征向量维数阈值的确定第54-56页
   ·本章小结第56-57页
第5章 文档自动分类系统实现及分析第57-63页
   ·文档自动分类系统的实现第57-60页
     ·系统架构第57-58页
     ·系统模块介绍第58-60页
   ·文档自动分类的评价标准第60-61页
     ·分类准确率第60页
     ·查全率(召回率)第60页
     ·F1值第60-61页
   ·实验结果及分析第61-63页
     ·中文分词实验结果第61页
     ·分类系统实验结果第61-63页
第6章 结论与展望第63-65页
   ·全文总结第63页
   ·后续工作与展望第63-65页
致谢第65-66页
参考文献第66-70页
附录I 中文分词示例文本数据第70-72页
攻读硕士学位期间发表的论文第72页

论文共72页,点击 下载论文
上一篇:机车能耗分析与司机操纵评价管理系统的设计与实现
下一篇:Web挖掘相关问题的研究