互联网信息采集分析系统的研究及实现

中文摘要	第1-5页
英文摘要	第5-9页
1 绪论	第9-15页
·项目背景及意义	第9-11页
·项目的主要内容	第11-12页
·本人的主要工作	第12-14页
·论文的组织结构	第14-15页
2 涉及的关键技术	第15-35页
·Web 中文文本挖掘	第15-22页
·Web 文本数据挖掘的概念	第15-17页
·Web 文本挖掘的处理过程	第17-18页
·文本挖掘的分类	第18-19页
·文本挖掘中的研究课题	第19-21页
·文本挖掘的应用领域	第21-22页
·信息获取技术	第22-23页
·信息获取定义和分类	第22页
·信息获取主要研究内容	第22-23页
·信息采集系统	第23页
·Web 文本自动分类	第23-28页
·信息获取技术	第24页
·文本的表示（文本模型）	第24页
·特征项的获取	第24-25页
·特征项的权重计算	第25页
·文本特征项的选取	第25-26页
·文本自动分类算法	第26-28页
·文本自动分类的性能评价	第28页
·基于支持向量机的分类算法	第28-35页
·支持向量机概述	第28-29页
·支持向量机原理	第29-33页
·支持向量机在数据挖掘应用	第33-35页
3 系统概述	第35-39页
·系统的目标及需求分析	第35-36页
·系统总体结构	第36-39页
4 信息采集子系统	第39-55页
·传统方式存在问题	第39-40页
·本系统网站数据模型	第40-41页
·几种典型的网站结构模型	第41-49页
·留言板	第42-43页
·论坛	第43-46页
·新闻网站	第46-49页
·功能描述	第49页
·模块结构	第49-51页
·采集算法	第51-52页
·设计及实现	第52-54页
·性能测试	第54-55页
5 信息检索子系统	第55-57页
·功能描述	第55页
·设计及实现	第55-57页
6 信息分类子系统	第57-71页
·文本分类技术实现信息发现的可行性	第57页
·Web 文本自动分类	第57-58页
·SVM-light	第58-61页
·参数设置	第59-60页
·输入输出文件格式	第60-61页
·功能描述	第61-64页
·设计及实现	第64-65页
·实际应用效果	第65-71页
·测试案例	第65-67页
·测试结果	第67-71页
7 Web 文本分类特征选择问题探讨	第71-85页
·算法测试	第71-80页
·样本分析	第80-81页
·结果分析和小结	第81-85页
8 总结	第85-87页
致谢	第87-89页
参考文献	第89-93页
附录：作者在攻读硕士学位期间参加的科研项目及得奖情况	第93-94页
独创性声明	第94页
学位论文版权使用授权书	第94页