首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

针对UGC数据进行的数据挖掘的研究与实现

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 引言第9-16页
   ·信息检索技术简介第9-10页
     ·信息检索中的一些概念第9-10页
   ·统计机器学习的方法与技术简介第10-12页
     ·机器学习的一些概念第10-11页
     ·利用机器学习的方法实现文本分类的任务第11页
     ·利用机器学习的方法实现文本聚类的任务第11页
     ·K-means文本聚类学习方法第11-12页
     ·自动摘要技术简介第12页
   ·用户产生内容(UGC)技术简介第12-15页
     ·社交网络技术第12-13页
     ·用户产生内容(UGC)简介第13-14页
     ·基于UGC的技术发展现状第14-15页
   ·论文各部分的主要内容第15-16页
第二章 基于Twitter数据下具有自动摘要功能的分析系统第16-26页
   ·基于UGC数据实现的功能第16-17页
   ·基于Twitter数据的具备信息过滤功能的自动摘要的系统介绍第17-25页
   ·系统的基本框架第25-26页
第三章 基于关键词和用户评价的Twitter数据检索方法第26-35页
   ·利用爬虫技术实现信息检索第26-27页
     ·通过网页源码解析第26页
     ·通过网站提供的API第26-27页
   ·系统爬虫器的策略第27-29页
     ·基于关键词(TRACK)评价的检索策略第29-32页
   ·基于用户关注(FOLLOW)评价的检索策略第32-34页
     ·用户活跃度(Activity)的计算方法第33页
     ·用户权威度(Authority)的计算方法第33-34页
   ·用户更新策略第34-35页
第四章 利用分类学习方法提高数据相关性质量第35-53页
   ·利用分类学习方法实现数据过滤的意义第35页
   ·垃圾文本数据的过滤方法第35-53页
     ·基于关键词及其位置信息的贝叶斯分类学习方法第35-40页
     ·基于统计数据一般高频特征的贝叶斯分类学习方法第40-43页
     ·基于统计数据符号分布比例的贝叶斯分类学习方法第43-46页
     ·三种特征的融合方法第46-53页
第五章 利用WAF实现特征选择的多文档自动摘要技术第53-61页
   ·基于WAF特征选择方法的自动摘要技术第53-59页
     ·利用WAF方法拓宽词与词之间的相关性第53页
     ·寻找亲近词组第53-56页
     ·以句子为单位,构建摘要内容候选集第56-58页
     ·结果优化第58-59页
   ·自动摘要更新技术第59-61页
     ·利用新颖性的定义评价句子的时效性第59-60页
     ·摘要更新的实现第60-61页
第六章 结束语第61-63页
参考文献第63-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:企业成本分析系统的设计与实现
下一篇:基于序列模式的手机病毒挖掘系统的设计与实现