首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

用于文本分类的简明语义分析技术研究

中文摘要第1-5页
英文摘要第5-11页
1 绪论第11-21页
   ·研究背景和意义第11-14页
     ·研究背景第11-12页
     ·选题意义第12-14页
   ·国内外研究现状第14-16页
     ·文本分类研究现状第15页
     ·文本分类难点第15-16页
   ·主要研究内容和目的第16-19页
     ·本文研究内容第17-18页
     ·研究目的和创新点第18-19页
   ·本文系统框架与组织结构第19-21页
2 文本分类相关技术综述第21-33页
   ·引言第21页
   ·文本分类简介第21-22页
   ·文本预处理与中文分词技术第22-24页
     ·文本清理技术第22-23页
     ·停用词去除第23页
     ·中文分词技术第23-24页
   ·文本表示技术第24-26页
     ·向量空间模型第24-25页
     ·词袋模型第25页
     ·语义分析技术第25-26页
   ·词语权值计算方法第26-28页
     ·文档级的词语权值计算方法第26页
     ·类别级的词语权值计算方法第26-28页
     ·语料库级的词语权值计算方法第28页
   ·分类算法第28-30页
     ·k 近邻算法第28-29页
     ·支持向量机算法第29-30页
   ·语料库第30-31页
   ·分类性能评估第31-32页
   ·本章小结第32-33页
3 简明语义分析第33-53页
   ·语义分析技术在文本分类中的应用第33-35页
     ·隐含语义分析第34-35页
     ·明确语义分析第35页
   ·简明语义分析的提出第35-36页
   ·构建基于类标信息的概念空间第36-38页
     ·直接派生第37页
     ·拆分派生第37页
     ·组合派生第37-38页
   ·词语与文本的表示第38-42页
     ·词语的表示第39-41页
     ·文本的表示第41-42页
   ·简明语义分析的算法流程第42-44页
   ·实验与分析第44-51页
     ·数据集第44-46页
     ·实验设置第46页
     ·实验结果与分析第46-51页
   ·本章小结第51-53页
4 简明语义分析的可扩展性与并行化第53-78页
   ·简明语义分析的数据依赖关系第53-54页
   ·简明语义分析的可扩展性第54-68页
     ·词频、文档频、平均文档长度、期望文档频的数量关系第55-57页
     ·可扩展性衡量指标第57-58页
     ·词可扩展性第58-61页
     ·文档可扩展性第61-65页
     ·类别/概念可扩展性第65-68页
   ·简明语义分析的并行化第68-75页
     ·PRAM 模型第69页
     ·并行化性能指标第69-70页
     ·并行化简明语义分析算法第70-75页
   ·本章小结第75-78页
5 基于简明语义分析的词串表示模型第78-98页
   ·文本表示过程中的信息损耗第78-80页
     ·熵、信息量与噪声信道模型第78-79页
     ·词袋模型的信息损耗第79-80页
   ·词串模型第80-83页
     ·完备的文本表示模型第80-82页
     ·词串模型的简化第82-83页
   ·基于CSA 的词串模型第83-86页
     ·文本向量串的粒度第83-84页
     ·文本向量串的长度第84-85页
     ·固定长度表示与固定粒度表示第85-86页
   ·有序向量串的相似度计算第86-91页
     ·单个向量的相似度计算第86-87页
     ·等长向量串的相似度计算第87-90页
     ·不等长向量串的相似度计算第90-91页
   ·词串模型在长文本分类中的应用第91-95页
     ·长文本的判定与参数设定第91-92页
     ·数据集第92页
     ·分类器设计第92页
     ·对比实验设计第92页
     ·实验结果与分析第92-95页
   ·本章小结第95-98页
6 基于简明语义分析的手机新闻推荐系统第98-110页
   ·新闻推荐系统简介第98-99页
     ·基于协同过滤的推荐系统第98页
     ·基于内容的推荐系统第98-99页
   ·手机新闻推荐系统的挑战第99-101页
     ·手机接入互联网的途径第99-100页
     ·新闻推荐系统的实时性要求第100页
     ·手机终端屏幕尺寸限制第100-101页
   ·基于CSA 的手机新闻推荐系统第101-105页
     ·用户兴趣形式化第101-102页
     ·兴趣度计算模块第102-103页
     ·新闻展示策略第103页
     ·隐私保护策略第103-105页
   ·基于CSA 的手机新闻系统原型展示第105-108页
   ·本章小结第108-110页
7 总结与展望第110-112页
   ·主要结论第110-111页
   ·后续工作展望第111-112页
致谢第112-114页
参考文献第114-122页
附录第122页
 A 作者攻读博士学位期间发表的学术论文第122页
 B 作者攻读博士学位期间参与的科研项目第122页

论文共122页,点击 下载论文
上一篇:计算机病毒和HIV病毒最优控制模型
下一篇:水质时间序列数据挖掘及其应用集成研究