首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

WEB内容监控的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-17页
   ·选题研究背景与意义第10-13页
     ·我国互联网发展现状第10-12页
     ·互联网上不良信息问题第12页
     ·WCMS系统简述第12-13页
   ·国内外研究现状第13-15页
     ·国外研究情况第13-14页
     ·国内研究情况第14-15页
   ·本文的组织结构第15-17页
第二章 WEB内容监控关键技术研究第17-31页
   ·WEB数据采集第17-21页
     ·Nutch网络爬虫研究第17-20页
     ·Nutch插件机制介绍第20-21页
   ·WEB信息抽取第21-22页
     ·手工方法(Manual Approach)第21页
     ·包装器归纳(Wrapper Induction)第21页
     ·自动抽取(Automatic Extraction)第21-22页
   ·文本挖掘技术第22-30页
     ·文本表示模型VSM第23-24页
     ·文本特征提取第24-25页
     ·文本分类第25-26页
     ·文本聚类第26-27页
     ·基于WEKA平台的验证第27-30页
   ·本章小结第30-31页
第三章 WCMS总体框架设计第31-36页
   ·WCMS功能介绍第31-32页
   ·WCMS的总体结构第32-33页
   ·WCMS数据处理流程第33-35页
   ·系统开发环境和开发工具第35页
   ·本章小结第35-36页
第四章 WCMS的详细设计与实现第36-60页
   ·WCMS爬虫与信息抽取模块第37-41页
     ·网页正文提取的设计与实现第37-39页
     ·WCMS爬虫的设计与实现第39-41页
   ·WCMS信息处理模块第41-57页
     ·文本预处理的设计与实现第41-44页
     ·WCMS分类器的设计与实现第44-52页
     ·WCMS聚类的设计与实现第52-54页
     ·网页热点程度评估方法的设计与实现第54-55页
     ·网页内容索引的设计与实现第55-57页
   ·WCMS监控管理模块第57-59页
     ·信息展示的设计与实现第57-59页
     ·监控站点管理的设计与实现第59页
     ·网页内容检索的设计与实现第59页
   ·本章小结第59-60页
第五章 WCMS系统测试第60-67页
   ·WCMS爬虫与信息抽取模块测试第60-63页
     ·网页正文内容提取测试第60-61页
     ·WCMS爬虫测试第61-63页
   ·WCMS信息处理模块测试第63-64页
     ·WCMS分类器的测试第63-64页
     ·WCMS聚类的测试第64页
   ·WCMS监控管理模块测试第64-66页
     ·信息展示的测试第64-65页
     ·网页内容检索的测试第65-66页
   ·本章小结第66-67页
第六章 总结与展望第67-69页
   ·本论文的工作总结第67页
   ·进一步的研究展望第67-69页
致谢第69-70页
参考文献第70-73页
攻硕期间取得的研究成果第73页

论文共73页,点击 下载论文
上一篇:地铁票务管理系统的设计与实现
下一篇:基于S5PC100的智能物流终端支撑软件系统研究