首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于概率的潜在语义分析模型在搜索引擎商业文本分类系统中的应用研究

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-8页
目录第8-11页
1. 引言第11-16页
   ·研究背景第11-13页
   ·国内外研究现状第13页
   ·研究意义第13-14页
   ·论文的研究方法第14-15页
   ·论文的组织结构第15-16页
2. 业务需求分析第16-22页
   ·角色行为分析第16-18页
     ·搜索用户行为分析第17页
     ·广告客户行为分析第17-18页
     ·搜索引擎公司行为分析第18页
   ·业务需求目标定位第18页
   ·资源结构分析第18-21页
     ·务资源结构第19-20页
     ·系统资源结构第20-21页
   ·务风险分析及应对策略第21-22页
3. 文本分类理论概述第22-32页
   ·文本分类的基本概念第22-23页
   ·文本的训练样本集第23页
   ·文本的表示模型第23-24页
   ·文本的特征选择第24-27页
     ·信息增益法(Information Gain)第25-26页
     ·信息法(Mutual Information,MI)第26页
     ·χ~2统计量第26-27页
   ·文本分类器的设计第27-31页
     ·中心向量法第27页
     ·朴素贝叶斯分类法第27-29页
     ·KNN(K最近邻居)算法第29页
     ·基于投票的方法第29-30页
     ·支持向量机(SVM)第30-31页
   ·文本分类器评估方法第31-32页
4. 系统关键技术及解决方案第32-38页
   ·潜在语义分析模型第32-34页
   ·潜在概率语义分析模型第34-38页
     ·潜在概率语义模型概述第34-36页
     ·模型主题的设定及其语义表达第36-38页
5. 潜在概率语义模型的设计与实现第38-53页
   ·模型总体设计第38-40页
     ·训练层第38-39页
     ·应用层第39页
     ·输出层第39-40页
   ·模型功能模块设计第40-47页
     ·文本预处理模块第40-41页
     ·词频统计模块第41-42页
     ·迭代计算模块第42-45页
     ·字典压缩模块第45页
     ·相关度计算模块第45-47页
   ·数据结构设计第47-48页
   ·接口设计第48-50页
   ·异常处理设计第50-53页
6. 测试与结果分析第53-59页
   ·测试标准第53-55页
     ·相关性评分机制第53-54页
     ·人员评分保障机制第54页
     ·评估样本抽样机制及跟踪机制第54-55页
     ·绝对指标衡量机制第55页
   ·测试平台第55-56页
   ·测试结果分析第56-59页
     ·相关性评估数据分布对比第56-57页
     ·点击率和展现率数据对比分析第57-59页
7. 总结与展望第59-61页
   ·总结第59页
   ·展望第59-61页
8. 参考文献第61-63页
9. 附录第63-65页
索引第65-66页
作者简历第66-68页
学位论文数据集第68页

论文共68页,点击 下载论文
上一篇:京翰教育发展战略研究
下一篇:高电子迁移率晶体管的建模和优化