基于主题特征的Web信息挖掘模型的研究与实现

摘要	第1-5页
ABSTRACT	第5-10页
第一章绪论	第10-14页
·研究背景和意义	第10-11页
·国内外现状	第11-12页
·论文的主要工作	第12页
·本文组织结构	第12-14页
第二章 Web信息挖掘和主题特征的研究	第14-21页
·Web信息挖掘	第14-15页
·Web结构挖掘	第14页
·Web内容挖掘	第14-15页
·Web使用挖掘	第15页
·主题特征归纳	第15-19页
·主题描述特征	第15-16页
·主题网页特征	第16-18页
·链接特征	第18-19页
·主题站点垂直挖掘模型研究	第19-20页
·本章小结	第20-21页
第三章基于URL特征的网站结构信息挖掘	第21-36页
·相关研究发展状况	第21页
·网站结构特征研究	第21-25页
·网站的结构研究	第21-23页
·网站内的单个页面结构特征分析	第23-24页
·网站的全局特征分析	第24-25页
·URL特征研究	第25-27页
·URL介绍	第25-26页
·URL特征分析	第26-27页
·基于URL特征的网站结构挖掘	第27-35页
·三元组URL描述法	第27-28页
·URL树	第28页
·URL链接解析	第28-29页
·网站三元组URL树	第29-31页
·基于三元组URL树的网站信息挖掘	第31-35页
·本章小结	第35-36页
第四章中文网页正文内容抽取方法的研究与实现	第36-46页
·相关研究发展状况	第36-37页
·网页标题抽取方法的研究	第37-39页
·锚文本和标题的相似度分析	第37页
·标题的自然语言规则研究	第37-38页
·基于多条件决策的网页正文标题抽取方法流程	第38-39页
·标题和正文依存距离研究	第39-41页
·依存树模型分析	第39页
·网页解析	第39-41页
·基于TCDT的中文网页正文抽取方法	第41-43页
·正文节点统计特性	第41页
·依存距离模型分析	第41-43页
·基于TCDT的中文网页正文抽取方法流程	第43-44页
·实验结果	第44-45页
·本章小结	第45-46页
第五章 Web网页细粒度信息抽取方法的研究	第46-63页
·相关研究发展状况	第46-47页
·网页粒度理论研究	第47-51页
·网页粒度理论	第47-48页
·网页结构特征分析	第48-51页
·网页属性化思想	第51-53页
·网页文本特征研究	第51-52页
·网页属性项文本	第52-53页
·基于语义和规则的网页细粒度信息抽取模型	第53-54页
·语义解析模块	第54-57页
·语义词典的构造	第54-55页
·相似度计算公式	第55-57页
·网页属性项抽取	第57-62页
·属性项文本和自由文本预处理	第57-58页
·属性项文本抽取属性项	第58-60页
·段落中抽取属性项	第60-62页
·本章小结	第62-63页
第六章站点垂直挖掘系统的实现	第63-73页
·站点垂直挖掘系统设计	第63-65页
·需求分析	第63页
·站点垂直挖掘系统整体设计	第63-65页
·基于三元组URL描述法的结构挖掘实现	第65-68页
·招标URL页面分类步骤	第65-67页
·实验结果	第67-68页
·基于语义和规则的内容挖掘模块的实现	第68-72页
·招标词典构造和抽取规则制定	第68-70页
·实验结果	第70-72页
·本章小结	第72-73页
第七章总结与展望	第73-75页
·总结	第73页
·展望	第73-75页
参考文献	第75-79页
致谢	第79-80页
攻读学位期间发表的学术论文目录	第80页