Web信息采集技术在纺织面料公共服务平台中的应用

摘要	第1-7页
ABSTRACT	第7-12页
第一章绪论	第12-18页
·纺织面料公共服务平台的产生背景	第12-13页
·平台对WEB信息采集提出的要求	第13-14页
·本论文的研究内容及结构	第14-18页
第二章纺织面料公共服务平台	第18-24页
·引言	第18页
·纺织面料公共服务平台的体系架构设计	第18-20页
·纺织面料公共服务平台的后台框架设计	第20-21页
·纺织面料公共服务平台的商务信息设计	第21-23页
·本章小结	第23-24页
第三章 WEB信息采集	第24-46页
·引言	第24页
·WEB信息采集的产生	第24-25页
·WEB信息采集的分类	第25-29页
·基于主题的信息采集	第25-26页
·基于用户个性化的WEB信息采集	第26-27页
·基于AGENT的信息采集	第27-28页
·基于元搜索的信息采集	第28-29页
·基于主题的WEB信息采集的流程	第29-43页
·网络蜘蛛	第31-32页
·页面过滤	第32-42页
·分词	第33-35页
·标注	第35-37页
·特征提取	第37-39页
·文本分类	第39-42页
·URL过滤器	第42-43页
·基于主题的WEB信息采集的难点	第43-44页
·本章小结	第44-46页
第四章纺织面料公共服务平台中WEB信息采集的设计	第46-83页
·引言	第46页
·纺织面料企业WEB信息采集的总体框架	第46-48页
·纺织面料企业站点采集	第48-53页
·网络蜘蛛工作模型	第49-50页
·站点连接模型的实现	第50-53页
·页面类型判断	第53-63页
·页面结构分析与内容获取	第53-58页
·页面结构特征	第53-54页
·超链接分析与获取	第54-56页
·标题、正文、METADATA信息分析与获取	第56-58页
·向量空间模型	第58-63页
·经典的向量空间模型及改进	第58-62页
·纺织面料企业的向量表示	第62-63页
·向量空间模型的应用	第63页
·面料企业的链接过滤/链接预测	第63-69页
·主题在WEB页面分布特征	第64-66页
·HUB/AUTHORITY特性	第64-65页
·SIBLING/LINKAGE LOCALITY特性	第65页
·站点主题特性	第65页
·TUNNEL特性	第65-66页
·链接与主题的相关度计算	第66-69页
·纺织面料企业的信息抽取	第69-77页
·纺织面料企业的抽取规则	第73-76页
·纺织面料企业的信息抽取	第76-77页
·纺织面料企业的文本分类	第77-81页
·纺织面料企业的文本训练	第78-80页
·纺织面料企业的文本分类	第80-81页
·本章小结	第81-83页
第五章 WEB信息采集系统的性能测试	第83-87页
·引言	第83页
·系统性能测试	第83-86页
·本章小结	第86-87页
第六章总结与展望	第87-89页
参考文献	第89-95页
作者攻读硕士学位期间参加的科研项目和发表的论文	第95-97页
致谢	第97页