首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于关键词的文本分类研究

摘要第1-6页
ABSTRACT第6-10页
第一章 绪论第10-15页
   ·研究背景及意义第10-11页
     ·研究背景第10页
     ·研究意义第10-11页
   ·研究现状第11-12页
   ·研究内容第12-13页
   ·组织结构第13-15页
第二章 文本分类概述第15-24页
   ·文本预处理与文本表示第15-18页
     ·文本预处理第15-16页
     ·文本表示第16-17页
     ·特征选择第17-18页
   ·文本分类相关算法第18-21页
     ·基于质心的文本分类算法第18-19页
     ·朴素贝叶斯分类算法第19页
     ·K 近邻分类算法第19-20页
     ·决策树分类算法第20页
     ·人工神经网络分类算法第20页
     ·支持向量机分类算法第20-21页
   ·性能评价与相关语料库第21-23页
     ·性能评价第21-22页
     ·相关语料库第22-23页
   ·本章小结第23-24页
第三章 标记样本不足的文本分类研究方法第24-28页
   ·基于部分标记样本和大量的未标记样本构建分类器第24-25页
   ·基于正例样本和大量的未标记样本构建分类器第25-26页
   ·基于关键词和大量的未标记样本构建分类器第26-27页
   ·本章小结第27-28页
第四章 通过关键词和未标记样本建立分类器的新方法第28-38页
   ·知网简介第28-29页
   ·文档检索第29-30页
     ·查询关键词的语义扩展第29-30页
     ·计算查询词与文档间的相似度第30页
   ·从检索文档中标记部分正例样本第30-32页
   ·扩展正例样本第32-33页
   ·文档分类第33-34页
   ·实验第34-37页
     ·准备数据第34-35页
     ·实验设置第35页
     ·实验结果第35-37页
   ·本章小结第37-38页
第五章 通过关键词和维基百科知识建立分类器的新方法第38-47页
   ·维基百科简介第38-39页
   ·通过关键词从维基百科中抽取相关维基文档第39-40页
   ·通过相关的维基百科文档从未标记样本中抽取正例样本第40-43页
     ·抽取正例的代表特征第40-41页
     ·分割未标记样本第41-42页
     ·从不确定的样本中抽取正例样本第42页
     ·迭代抽取更多的正例样本第42-43页
   ·分类算法第43-44页
   ·实验第44-46页
     ·数据集第44-45页
     ·实验设置第45页
     ·实验结果第45-46页
   ·本章小结第46-47页
第六章 总结与展望第47-49页
   ·总结第47页
   ·展望第47-49页
参考文献第49-52页
致谢第52-53页
作者简介第53页

论文共53页,点击 下载论文
上一篇:Web信息抽取技术研究
下一篇:多标签数据流分类研究