首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

社会媒体网页内容分割与主题频繁簇的抽取

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-14页
   ·研究背景及研究意义第8-9页
   ·国内外研究现状第9-12页
     ·基于自然语言处理方式的信息抽取第9-10页
     ·基于包装器归纳方式的信息抽取第10-11页
     ·基于人工本体方式的信息抽取第11页
     ·基于HTML 结构分析方式的信息抽取第11页
     ·基于隐马尔可夫模型方式的信息抽取第11-12页
     ·基于自定义Web 查询方式的信息抽取第12页
   ·本论文的研究内容第12-13页
   ·本论文的内容组织第13-14页
第2章 相关背景知识介绍第14-25页
   ·Web 页面半结构化特点第14页
   ·信息检索及信息抽取第14-16页
   ·Web 信息抽取第16-18页
   ·Web 信息抽取中应用的网页技术标准第18-22页
     ·HTML第18-19页
     ·XML第19-21页
     ·XHTML第21-22页
   ·DOM第22页
   ·k-means 聚簇方法第22-24页
   ·本章小结第24-25页
第3章 社会媒体网页内容的分割与主题频繁簇的抽取系统设计第25-33页
   ·概述第25页
   ·整体研究思路第25-28页
   ·系统总体流程图第28页
   ·社会媒体网页内容分割与主题频繁簇的抽取算法第28-32页
     ·社会媒体页面的收集第28-29页
     ·社会媒体页面的预处理第29-30页
     ·频繁块的识别第30页
     ·主题频繁簇的识别第30-31页
     ·抽取规则的生成第31-32页
   ·本章小结第32-33页
第4章 社会媒体网页内容的分割与主题频繁簇的抽取系统实现第33-46页
   ·概述第33页
   ·社会媒体页面的收集第33页
   ·社会媒体页面的预处理第33-36页
     ·文档清理第34-35页
     ·文档解析第35-36页
   ·社会媒体页面内容的分割第36-39页
     ·频繁块的识别第36-39页
     ·主题频繁簇的识别第39页
   ·抽取规则的生成第39-42页
   ·信息抽取第42-43页
   ·实验结果与分析第43-45页
     ·实验数据第43-44页
     ·主题频繁簇中频繁块识别的实验结果与分析第44页
     ·抽取规则生成的实验结果与分析第44-45页
   ·本章小结第45-46页
第5章 结论和展望第46-48页
   ·结论第46-47页
   ·展望第47-48页
参考文献第48-51页
致谢第51-52页
附录A (攻读硕士学位期间参与的项目及投发的论文)第52页

论文共52页,点击 下载论文
上一篇:带交叉变异算子的自适应粒子群聚类算法的研究
下一篇:基于音频指纹的广告检测技术研究