改进空间向量模型及其在文档自动分类系统中的应用

摘要	第1-7页
ABSTRACT	第7-11页
第1章绪论	第11-18页
·论文研究的背景及意义	第11-12页
·国内外研究发展现状	第12-13页
·文档自动分类在信息处理中的应用	第13-15页
·搜索引擎	第13-14页
·邮件分类	第14页
·信息过滤	第14页
·主动推送服务	第14-15页
·文档自动分类系统架构	第15-16页
·系统框架	第15-16页
·文档预处理	第16页
·特征选取	第16页
·文档训练及分类测试	第16页
·本论文的主要工作	第16-17页
·论文安排与主要研究工作	第17-18页
第2章文档自动分类系统与关键技术分析	第18-38页
·文档预处理	第18-19页
·文本预处理过程实现	第18-19页
·文档特征提取	第19-25页
·文档频率	第21-22页
·互信息MI	第22-23页
·信息增益IG	第23-24页
·x~2统计法	第24页
·词条强度法	第24-25页
·文档分类模型	第25-30页
·经典的分类方法	第25-28页
·向量空间模型	第28-30页
·文档中英文分词	第30-38页
·简单扫描匹配法	第31-33页
·扫描及条件决策法	第33-34页
·复杂人工智能方法	第34-38页
第3章基于概率统计和查找树的中文分词算法	第38-48页
·现阶段中文分词存在的问题	第38页
·基于概率统计和查找树的中文分词算法	第38-47页
·问题的提出	第38-39页
·概率统计模型	第39-45页
·查找树	第45-47页
·本章小结	第47-48页
第4章基于段落和词距向量的空间向量模型	第48-57页
·传统向量空间模型存在的问题	第48页
·文档的预处理	第48-49页
·基于段落向量和词距向量的特征提取算法	第49-56页
·段落在表达文档上的重要作用	第49-50页
·段落向量和词距向量	第50-52页
·特征提取示例	第52-54页
·特征向量维数阈值的确定	第54-56页
·本章小结	第56-57页
第5章文档自动分类系统实现及分析	第57-63页
·文档自动分类系统的实现	第57-60页
·系统架构	第57-58页
·系统模块介绍	第58-60页
·文档自动分类的评价标准	第60-61页
·分类准确率	第60页
·查全率(召回率)	第60页
·F1值	第60-61页
·实验结果及分析	第61-63页
·中文分词实验结果	第61页
·分类系统实验结果	第61-63页
第6章结论与展望	第63-65页
·全文总结	第63页
·后续工作与展望	第63-65页
致谢	第65-66页
参考文献	第66-70页
附录I 中文分词示例文本数据	第70-72页
攻读硕士学位期间发表的论文	第72页