中文文本信息过滤技术研究

摘要	第1-4页
Abstract	第4-7页
第一章引言	第7-15页
·文本信息过滤的研究背景及意义	第7-9页
·国内外研究现状	第9-12页
·本文的主要研究内容及其安排	第12-15页
第二章 Web 文档处理	第15-25页
·Web 文档预处理	第15-17页
·中文自动分词	第17-20页
·现有的分词算法	第17-19页
·基于Hash 结构的机械统计分词方法	第19-20页
·文本分类	第20-23页
·基于外延的分类	第21页
·基于语义的分类	第21-22页
·基于LSI 和Rough 集的文本分类	第22-23页
·本章小结	第23-25页
第三章文本信息过滤的逻辑模型	第25-33页
·向量空间模型	第26-29页
·特征项的选择	第27-28页
·特征权重的计算	第28-29页
·文档相似度的计算	第29页
·潜在语义索引模型	第29-31页
·词-文档矩阵的建立	第29-30页
·奇异值分解	第30-31页
·基于概念索引的模型	第31-32页
·本章小结	第32-33页
第四章用户兴趣模板的构造及更新	第33-39页
·用户兴趣模板构造	第33-36页
·基于伪相关反馈的用户兴趣模板构造	第33-34页
·基于Rocchio 算法的用户兴趣模板构造	第34页
·基于查询扩展的用户兴趣模板构造	第34-36页
·用户兴趣模板更新	第36-38页
·本章小结	第38-39页
第五章文本信息过滤的过滤策略	第39-45页
·阈值学习	第39-43页
·Direct Utility 方法	第39-40页
·Beta-Gamma 方法	第40-41页
·Logistic Regression 方法	第41-42页
·Score Distribution 方法	第42-43页
·基于典型反馈的文本推荐	第43-44页
·本章小结	第44-45页
第六章中文文本信息过滤系统研究与实现	第45-51页
·个性化文本信息过滤系统	第45-49页
·用户兴趣模式更新策略	第47-48页
·信息过滤策略	第48页
·智能决策推荐	第48页
·与其他Agent 通讯机制	第48-49页
·系统评估及测试	第49-50页
·系统评估方法	第49页
·系统测试结果分析	第49-50页
·本章小结	第50-51页
第七章总结	第51-53页
参考文献	第53-56页
致谢	第56-57页
在读期间发表论文	第57-58页