首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本分类的属性选择与多标记转换方法研究

致谢第1-6页
摘要第6-7页
ABSTRACT第7-12页
1 引言第12-16页
   ·研究背景第12-13页
   ·研究意义第13-14页
     ·属性选择第13页
     ·多标记学习第13-14页
   ·本文主要研究工作第14页
   ·本文组织结构第14-16页
2 文本分类相关技术第16-33页
   ·分词处理第17-20页
     ·词的界定第17-18页
     ·去除停用词第18页
     ·词干抽取第18页
     ·词语切分第18-19页
     ·分词工具第19-20页
   ·特征表示第20-23页
     ·特征表示模型第20-21页
     ·权值计算第21-23页
     ·不同权值计算方法的比较第23页
   ·特征提取第23-25页
     ·特征抽取第24页
     ·特征选择第24-25页
   ·分类算法第25-29页
     ·基于规则的方法第25页
     ·基于统计的方法第25-29页
   ·性能评价第29-32页
     ·正确率第29页
     ·召回率第29-30页
     ·F-测度值第30页
     ·微平均和宏平均第30-31页
     ·BEP测度值第31页
     ·11点平均正确率第31-32页
   ·本章小结第32-33页
3 属性选择方法及改进第33-43页
   ·属性选择方法第33-36页
     ·文档频率第33-34页
     ·信息增益第34页
     ·交叉熵方法第34页
     ·互信息第34-35页
     ·χ~2估计第35页
     ·文本证据权第35-36页
   ·常见属性选择方法的分析及不足第36-37页
     ·属性选择方法分析与比较第36页
     ·现有方法的不足第36-37页
   ·对属性选择的改进第37-40页
     ·改进算法的整体思想第38-39页
     ·改进的文档频率法第39页
     ·改进的信息增益法第39-40页
     ·改进的互信息法第40页
     ·改进的χ~2估计法第40页
   ·算法描述第40-41页
   ·本章小结第41-43页
4 多标记文本转换方法及改进第43-52页
   ·多标记数据的建模和学习第43页
   ·多标记指派模型第43-50页
     ·全标记指派模型第44页
     ·无标记指派模型第44页
     ·最大标记指派模型第44页
     ·最小标记指派模型第44-45页
     ·标记幂集模型第45页
     ·基于熵的标记指派模型第45-50页
   ·算法描述第50页
   ·本章小结第50-52页
5 实验设计及结果分析第52-62页
   ·实验环境及工具第52-53页
   ·实验数据处理第53-56页
     ·Reuters-21578第53-55页
     ·RCV1第55-56页
   ·属性选择实验结果与分析第56-58页
     ·属性选择实验结果第56-58页
     ·属性选择结果分析第58页
   ·多标记转换实验结果与分析第58-61页
     ·多标记转换实验结果第59-60页
     ·多标记转换结果分析第60-61页
   ·本章小结第61-62页
6 结论与展望第62-65页
   ·工作总结第62-64页
   ·工作展望第64-65页
参考文献第65-68页
作者简历第68-70页
学位论文数据集第70页

论文共70页,点击 下载论文
上一篇:手指静脉特征认证算法研究与纯硬件实现
下一篇:高速铁路与社会经济发展互动关系决策支持系统模型库开发及关键问题的研究