Web观点挖掘系统的关键技术研究
摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-18页 |
·选题背景 | 第9-10页 |
·选题意义 | 第10-11页 |
·国内外研究现状简介 | 第11-14页 |
·国外研究现状 | 第12-13页 |
·国内研究现状 | 第13-14页 |
·论文主要工作及组织结构 | 第14-18页 |
·论文主要工作 | 第14-16页 |
·论文组织结构 | 第16-18页 |
2 相关概念和基础理论 | 第18-30页 |
·传统的基于主题的搜索引擎 | 第18页 |
·Web2.0的概念及特点 | 第18-19页 |
·Web2.0下的观点搜索系统 | 第19页 |
·文本挖掘的相关技术 | 第19-29页 |
·传统数据模型介绍 | 第20-22页 |
·特征选择 | 第22-25页 |
·文本分类方法 | 第25-27页 |
·评价标准 | 第27-29页 |
·本章小结 | 第29-30页 |
3 WEB网页采集技术 | 第30-39页 |
·问题描述 | 第30页 |
·理论基础 | 第30-35页 |
·聚焦爬虫技术 | 第32页 |
·聚焦爬虫原理 | 第32-33页 |
·聚焦爬虫采集策略 | 第33-34页 |
·聚焦爬虫系统平台的搭建 | 第34-35页 |
·实验设计 | 第35-37页 |
·评价标准和实验结果分析 | 第37页 |
·本章小结 | 第37-39页 |
4 低质量中文商品评论的过滤 | 第39-54页 |
·问题描述 | 第39-40页 |
·相关研究工作 | 第40页 |
·数据集及预处理 | 第40-43页 |
·基于最大熵和SVM的中文低质量商品评论的检测 | 第43-49页 |
·基于最大熵的主客观分类 | 第43-46页 |
·商品与商品评论的相关性的SVM分类 | 第46-49页 |
·实验及相关分析 | 第49-52页 |
·本章小结 | 第52-54页 |
5 主观性评论文本情感倾向分类的研究 | 第54-61页 |
·观点挖掘的定义及研究颗粒度 | 第54页 |
·特征选取 | 第54页 |
·主观观点词典构造 | 第54-57页 |
·《知网》简介 | 第55-56页 |
·主观观点种子的获取造 | 第56-57页 |
·主观观点词词典的构建 | 第57-59页 |
·本章小结 | 第59-61页 |
6 观点搜索系统框架 | 第61-66页 |
·现有的观点挖掘系统 | 第61页 |
·典型Pulse观点挖掘系统简介 | 第61-62页 |
·OMS系统的设计 | 第62-65页 |
·本章小结 | 第65-66页 |
7 总结与展望 | 第66-68页 |
·本文总结 | 第66-67页 |
·未来展望 | 第67-68页 |
参考文献 | 第68-72页 |
致谢 | 第72-74页 |
攻读硕士学位期间发表的学术论文目录 | 第74-75页 |