首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

论坛垃圾回帖的识别与过滤

摘要第1-6页
Abstract第6-11页
第1章 绪论第11-16页
   ·课题的研究背景及意义第11-12页
   ·垃圾评论研究现状第12-14页
   ·本文主要工作第14页
   ·论文结构安排第14-15页
   ·本章小结第15-16页
第2章 文本分类知识简介第16-29页
   ·文本预处理第16-18页
     ·文档切分第17页
     ·文本分词第17页
     ·去停用词第17-18页
   ·文本表示模型第18页
   ·文本特征提取第18-21页
     ·词频方法(Word Frequency)第19页
     ·文档频次方法(Document Frequency)第19页
     ·互信息(Mutual Information)第19-20页
     ·期望交叉熵(Expected Cross Entropy)第20页
     ·信息增益方法(Information Gain)第20页
     ·χ~2统计量方法第20-21页
   ·特征权重第21-23页
     ·特征权重算法第21-22页
     ·影响特征提取的因素第22-23页
   ·文本分类器第23-25页
     ·朴素贝叶斯分类算法第23-24页
     ·KNN 算法第24-25页
     ·支持向量机第25页
   ·分类结果的评估第25-26页
   ·词语相似度第26-28页
     ·词语相似度的定义第26-27页
     ·《知网》的词语相似度计算第27页
     ·文本相似度第27-28页
   ·本章小结第28-29页
第3章 论坛回帖行为特点和语言特征的分析第29-35页
   ·网络语言的特点分析第29-30页
   ·论坛回帖行为特点分析第30-32页
   ·论坛回帖语言特征的分析第32-33页
   ·论坛领域内垃圾评论的定义第33-34页
   ·本章小结第34-35页
第4章 Web 数据自动采集系统第35-40页
   ·实验数据来源第35页
   ·系统设计第35-37页
   ·具体实现步骤第37-39页
   ·本章小结第39-40页
第5章 多层次识别过滤论坛垃圾回帖系统第40-50页
   ·论坛回帖数据预处理第40-41页
   ·多层次识别过滤论坛垃圾回帖系统第41-49页
   ·本章小结第49-50页
第6章 实验结果分析与应用第50-55页
   ·实验结果分析第50-52页
   ·发帖人回帖倾向性分析第52-54页
   ·本章小结第54-55页
第7章 总结与展望第55-57页
   ·课题总结第55页
   ·工作展望第55-57页
参考文献第57-59页
致谢第59-60页
攻读学位期间取得的科研成果第60页

论文共60页,点击 下载论文
上一篇:养老院景观设计分析研究--以河北阜城德隆老年服务中心为例
下一篇:数字档案与科技文件管理系统设计