基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究

致谢	第1-6页
中文摘要	第6-7页
ABSTRACT	第7-8页
目录	第8-11页
1. 引言	第11-16页
·研究背景	第11-13页
·国内外研究现状	第13页
·研究意义	第13-14页
·论文的研究方法	第14-15页
·论文的组织结构	第15-16页
2. 业务需求分析	第16-22页
·角色行为分析	第16-18页
·搜索用户行为分析	第17页
·广告客户行为分析	第17-18页
·搜索引擎公司行为分析	第18页
·业务需求目标定位	第18页
·资源结构分析	第18-21页
·务资源结构	第19-20页
·系统资源结构	第20-21页
·务风险分析及应对策略	第21-22页
3. 文本分类理论概述	第22-32页
·文本分类的基本概念	第22-23页
·文本的训练样本集	第23页
·文本的表示模型	第23-24页
·文本的特征选择	第24-27页
·信息增益法(Information Gain)	第25-26页
·信息法(Mutual Information,MI)	第26页
·χ~2统计量	第26-27页
·文本分类器的设计	第27-31页
·中心向量法	第27页
·朴素贝叶斯分类法	第27-29页
·KNN(K最近邻居)算法	第29页
·基于投票的方法	第29-30页
·支持向量机(SVM)	第30-31页
·文本分类器评估方法	第31-32页
4. 系统关键技术及解决方案	第32-38页
·潜在语义分析模型	第32-34页
·潜在概率语义分析模型	第34-38页
·潜在概率语义模型概述	第34-36页
·模型主题的设定及其语义表达	第36-38页
5. 潜在概率语义模型的设计与实现	第38-53页
·模型总体设计	第38-40页
·训练层	第38-39页
·应用层	第39页
·输出层	第39-40页
·模型功能模块设计	第40-47页
·文本预处理模块	第40-41页
·词频统计模块	第41-42页
·迭代计算模块	第42-45页
·字典压缩模块	第45页
·相关度计算模块	第45-47页
·数据结构设计	第47-48页
·接口设计	第48-50页
·异常处理设计	第50-53页
6. 测试与结果分析	第53-59页
·测试标准	第53-55页
·相关性评分机制	第53-54页
·人员评分保障机制	第54页
·评估样本抽样机制及跟踪机制	第54-55页
·绝对指标衡量机制	第55页
·测试平台	第55-56页
·测试结果分析	第56-59页
·相关性评估数据分布对比	第56-57页
·点击率和展现率数据对比分析	第57-59页
7. 总结与展望	第59-61页
·总结	第59页
·展望	第59-61页
8. 参考文献	第61-63页
9. 附录	第63-65页
索引	第65-66页
作者简历	第66-68页
学位论文数据集	第68页