基于Web分类技术的农业信息获取系统的研究与实现

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-17页
·课题的研究背景	第9页
·文本分类技术研究现状	第9-10页
·文本分类技术概述	第10-14页
·文本分类概念	第10-12页
·文本分类任务的特点和Web挖掘的特点	第12-13页
·文本分类的一般过程	第13-14页
·信息搜索的原理及研究现状	第14-15页
·搜索引擎的工作原理	第14-15页
·开源搜索引擎的研究现状	第15页
·本文研究内容以及本文的组织	第15-17页
第二章农业信息获取系统的相关技术	第17-42页
·训练文本集	第17页
·文档预处理	第17-22页
·网页的格式标记去除	第17-18页
·去除停顿词和词干化	第18-19页
·中文分词	第19-22页
·特征选取	第22-26页
·分类算法	第26-30页
·朴素贝叶斯	第27-28页
·K-近邻方法	第28页
·决策树方法	第28-29页
·支持向量机方法	第29-30页
·阈值策略	第30-31页
·文本分类器的评价标准	第31-32页
·网络爬取技术	第32-35页
·网络爬虫概述	第32-33页
·面向领域的网络爬虫	第33-35页
·Web信息抽取	第35-38页
·网页类型的特点	第35-36页
·DOM模型	第36-37页
·XSLT与XPath	第37-38页
·HtmlParser概述	第38页
·信息检索技术	第38-42页
·信息检索及全文检索介绍	第38-40页
·Lucene概述	第40-42页
第三章农业信息获取系统的总体设计	第42-46页
·农业信息获取系统的需求	第42页
·农业信息获取系统的功能模块设计	第42-43页
·农业信息获取系统的架构设计	第43-44页
·农业信息获取系统的总体流程设计	第44-46页
第四章农业信息获取系统的详细设计与实现	第46-79页
·网络爬取模块的详细设计与实现	第46-49页
·网络爬取模块的详细设计	第46-48页
·网络爬取模块的实现	第48-49页
·农业专业词库的详细设计与实现	第49-52页
·农业领域义原树的建立	第49-50页
·义原相似度计算	第50-52页
·农业词库的实现	第52页
·内容过滤器模块的详细设计与实现	第52-59页
·Web网页清洗	第53页
·内容过滤模块的流程设计	第53-57页
·内容过滤模块的实现	第57-59页
·中文网页分类子系统的详细设计与实现	第59-74页
·中文网页分类子系统的总体框架设计	第59-61页
·训练文本库的设计	第61-62页
·预处理设计	第62-66页
·特征选择设计	第66-68页
·基于专业词汇权重的计算	第68-69页
·中文网页分类器的设计与实现	第69-73页
·分类系统的评估	第73-74页
·用户偏好分析模块的设计	第74-76页
·信息检索模块的详细设计	第76-79页
第五章基于Web分类技术的农业信息获取系统的应用	第79-82页
·基于Web分类技术的农业信息获取系统实现的目的	第79页
·基于Web分类技术的农业信息获取系统体系结构	第79-80页
·基于Web分类技术的农业信息获取系统在"一键搜"中的应用	第80-82页
第六章结论与展望	第82-84页
·论文总结	第82页
·进一步的工作	第82-84页
参考文献	第84-86页
附录	第86-88页
致谢	第88页