首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向论坛的文本特征提取及分类技术研究

摘要第1-6页
Abstract第6-9页
第1章 绪论第9-13页
   ·研究背景及意义第9页
   ·国内外研究现状第9-11页
   ·本文主要工作第11-12页
   ·论文组织第12-13页
第2章 相关理论及关键技术第13-23页
   ·网络爬虫技术第13-15页
     ·网络爬虫的原理第13-14页
     ·网络爬虫的搜索策略第14-15页
   ·中文分词技术第15-17页
   ·概率主题模型第17-19页
     ·基本思想第17页
     ·LDA模型第17-19页
   ·基于词林的词义相似度计算第19-21页
     ·词林编码规律第19-20页
     ·词语相似度计算第20-21页
   ·K近邻分类算法第21-22页
     ·算法简介第21-22页
     ·算法改进第22页
   ·本章小结第22-23页
第3章 基于网络爬虫的论坛信息采集第23-31页
   ·论坛结构分析第23-24页
   ·网络爬虫设计第24-30页
     ·源代码下载第25-27页
     ·源代码中提取感兴趣信息第27-28页
     ·感兴趣信息的分类存储第28-30页
   ·本章小结第30-31页
第4章 文本预处理第31-35页
   ·文本净化第31-32页
   ·中文分词第32-33页
   ·初步降维第33-34页
   ·本章小结第34-35页
第5章 文本特征选择第35-39页
   ·基于LDA主题建模的文本特征表示第35-36页
   ·主题表示维度对主题特征的影响第36-37页
   ·基于词林的词义聚类第37-38页
   ·本章小结第38-39页
第6章 实验设计及结果分析第39-51页
   ·实验设计第39页
   ·测试实验第39-43页
   ·测试实验结果分析第43-47页
   ·应用实验第47-51页
     ·K近邻分类器设计第47-48页
     ·实验结果第48-51页
第7章 工作总结与展望第51-53页
   ·课题总结第51页
   ·研究与展望第51-53页
参考文献第53-56页
致谢第56-57页
攻读学位期间取得的科研成果第57页

论文共57页,点击 下载论文
上一篇:基于CNN超混沌加密的Shearlet域数字图像隐藏
下一篇:基于可信第三方的Android应用完整性验证模型