首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类和聚类中若干问题的研究

摘要第1-7页
ABSTRACT第7-12页
第一章 绪论第12-27页
   ·引言第12-13页
   ·课题研究背景第13-15页
   ·文本分类和聚类技术概述第15-18页
   ·文本分类和聚类领域面对的挑战第18-20页
   ·文本分类和聚类领域巫需解决的问题第20-21页
   ·本文的工作第21-23页
 参考文献第23-27页
第二章 基于统计模型的文本分类第27-73页
   ·引言第27-28页
   ·基于 Bayes方法的垃圾邮件过滤第28-41页
     ·Bayes方法第28-30页
     ·垃圾邮件过滤第30-31页
     ·基于朴素Bayes分类器的垃圾邮件过滤第31-34页
     ·文本预处理技术第34-37页
     ·基于增强朴素Bayes分类器的垃圾邮件过滤第37-41页
     ·本节小结第41页
   ·基于转导推理的无标签样本学习第41-50页
     ·转导推理第41-44页
     ·基于转导推理的无标签样本学习第44-45页
     ·联合无标签/有标签样本的垃圾邮件过滤第45-49页
     ·本节小结第49-50页
   ·基于字符级统计方法的文本分类第50-66页
     ·基于词频特性的统计方法及n-gram模型第50-52页
     ·字符级统计方法第52-55页
     ·基于字符级统计方法的垃圾邮件过滤第55-57页
     ·基于字符级统计方法的短信分类第57-65页
     ·本节小结第65-66页
   ·本章小结第66-67页
 参考文献第67-73页
第三章 基于分类器集成的文本分类第73-104页
   ·引言第73页
   ·分类器集成第73-76页
   ·基于投票的集成第76-83页
     ·基于投票的集成第76-79页
     ·集成性能的理论界限第79-83页
   ·基于 E+V(Error-Variance)分解的集成第83-87页
     ·E+V(Error-Variance)分解第83-86页
     ·集成性能的理论界限第86-87页
   ·基于分类器集成的文本分类第87-99页
     ·基于决策方法的选择性集成第88-93页
     ·基于|V|指标优化的集成第93-99页
   ·本章小结第99-101页
 参考文献第101-104页
第四章 基于非线性方法的文本聚类第104-127页
   ·引言第104-105页
   ·基于流形学习方法的文本信息处理第105-107页
     ·流形学习第105-107页
     ·基于流形学习方法的文本信息处理第107页
   ·中文词汇在语义空间中的分布第107-114页
     ·基本介绍第107-109页
     ·中文词汇在语义空间中的分布第109-111页
     ·基于词聚类特性的特征选择第111页
     ·实验结果第111-114页
   ·基于 WordNet的短信聚类第114-122页
     ·短信处理的重要性第114页
     ·WordNet语义词典第114-115页
     ·基于 WordNet的短信相似度计算第115-119页
     ·基于语义的短信聚类第119-120页
     ·实验结果第120-122页
   ·本章小结第122-124页
 参考文献第124-127页
第五章 结论与展望第127-130页
   ·本文的总结第127-128页
   ·进一步的工作第128-130页
致谢第130-131页
博士期间发表的论文第131-133页
附录1: 中文词汇列表(683词)第133-135页

论文共135页,点击 下载论文
上一篇:我国企业年金基金运行研究
下一篇:国有寿险公司偿付能力风险分析及其防范措施