一种舆情信息预处理平台的研究与实现

致谢	第1-6页
中文摘要	第6-7页
ABSTRACT	第7-11页
1 引言	第11-15页
·研究背景及意义	第11-12页
·国内外研究现状	第12-13页
·论文主要工作及结构	第13-15页
·研究工作和目标	第13-14页
·内容安排和结构	第14-15页
2 相关技术的研究	第15-23页
·基于XML的异构数据源访问中间件技术	第15-17页
·中间件简介	第15-16页
·可扩展标记语言XML简介	第16-17页
·异构数据源访问的解决方案	第17页
·中文分词技术及方法概述	第17-20页
·中文分词概念及难点	第18页
·中文分词常用方法	第18-19页
·中文分词常用方法比较及优缺点	第19-20页
·数据库优化技术	第20-22页
·数据库优化定义及优化策略	第20-21页
·表设计优化	第21-22页
·查询优化	第22页
·本章小结	第22-23页
3 舆情信息预处理平台总体设计	第23-33页
·舆情信息预处理平台介绍	第23-24页
·平台总体设计原则	第23页
·平台开发环境及开发工具	第23-24页
·舆情信息预处理的重点领域及信息来源	第24-25页
·新闻咨询类网站	第24页
·热点论坛	第24-25页
·中文博客	第25页
·舆情信息预处理平台设计	第25-32页
·平台总体业务流程	第25-26页
·平台模块组成及功能设计	第26-30页
·平台架构设计	第30-31页
·数据库设计	第31-32页
·本章小结	第32-33页
4 关键技术实现	第33-57页
·网页信息抽取算法与实现	第33-45页
·算法综述	第33-34页
·基于URL结构的特征比较法	第34-36页
·基于文档对象模型匹配的网页信息抽取方法	第36-42页
·网页信息抽取程序设计实现	第42-44页
·实验结果分析及算法评价	第44-45页
·中文分词技术及其实现	第45-52页
·分词词典概述	第46-47页
·四字索引分词词典	第47-49页
·基于分词词典的分词算法实现	第49-50页
·词频统计实现方法	第50-51页
·中文分词实验结果分析	第51-52页
·基于线程池的优化技术及其实现	第52-56页
·Java线程池	第52-53页
·线程池优化方案及实现	第53-55页
·优化结果分析及效果演示	第55-56页
·本章小结	第56-57页
5 结论与展望	第57-59页
·论文总结	第57-58页
·应用前景及展望	第58-59页
参考文献	第59-61页
作者简历	第61-63页
学位论文数据集	第63页