摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-9页 |
第一章 引言 | 第9-16页 |
·信息检索技术简介 | 第9-10页 |
·信息检索中的一些概念 | 第9-10页 |
·统计机器学习的方法与技术简介 | 第10-12页 |
·机器学习的一些概念 | 第10-11页 |
·利用机器学习的方法实现文本分类的任务 | 第11页 |
·利用机器学习的方法实现文本聚类的任务 | 第11页 |
·K-means文本聚类学习方法 | 第11-12页 |
·自动摘要技术简介 | 第12页 |
·用户产生内容(UGC)技术简介 | 第12-15页 |
·社交网络技术 | 第12-13页 |
·用户产生内容(UGC)简介 | 第13-14页 |
·基于UGC的技术发展现状 | 第14-15页 |
·论文各部分的主要内容 | 第15-16页 |
第二章 基于Twitter数据下具有自动摘要功能的分析系统 | 第16-26页 |
·基于UGC数据实现的功能 | 第16-17页 |
·基于Twitter数据的具备信息过滤功能的自动摘要的系统介绍 | 第17-25页 |
·系统的基本框架 | 第25-26页 |
第三章 基于关键词和用户评价的Twitter数据检索方法 | 第26-35页 |
·利用爬虫技术实现信息检索 | 第26-27页 |
·通过网页源码解析 | 第26页 |
·通过网站提供的API | 第26-27页 |
·系统爬虫器的策略 | 第27-29页 |
·基于关键词(TRACK)评价的检索策略 | 第29-32页 |
·基于用户关注(FOLLOW)评价的检索策略 | 第32-34页 |
·用户活跃度(Activity)的计算方法 | 第33页 |
·用户权威度(Authority)的计算方法 | 第33-34页 |
·用户更新策略 | 第34-35页 |
第四章 利用分类学习方法提高数据相关性质量 | 第35-53页 |
·利用分类学习方法实现数据过滤的意义 | 第35页 |
·垃圾文本数据的过滤方法 | 第35-53页 |
·基于关键词及其位置信息的贝叶斯分类学习方法 | 第35-40页 |
·基于统计数据一般高频特征的贝叶斯分类学习方法 | 第40-43页 |
·基于统计数据符号分布比例的贝叶斯分类学习方法 | 第43-46页 |
·三种特征的融合方法 | 第46-53页 |
第五章 利用WAF实现特征选择的多文档自动摘要技术 | 第53-61页 |
·基于WAF特征选择方法的自动摘要技术 | 第53-59页 |
·利用WAF方法拓宽词与词之间的相关性 | 第53页 |
·寻找亲近词组 | 第53-56页 |
·以句子为单位,构建摘要内容候选集 | 第56-58页 |
·结果优化 | 第58-59页 |
·自动摘要更新技术 | 第59-61页 |
·利用新颖性的定义评价句子的时效性 | 第59-60页 |
·摘要更新的实现 | 第60-61页 |
第六章 结束语 | 第61-63页 |
参考文献 | 第63-66页 |
致谢 | 第66页 |