Web信息挖掘的研究及应用

摘要	第1-5页
ABSTRACT	第5-8页
第一章绪论	第8-16页
·研究背景	第8-9页
·Web 信息抽取与挖掘的研究现状	第9-15页
·数据模型	第10-11页
·查询语言	第11-13页
·Web 文档页的数据抽取	第13-15页
·本文的主要工作	第15-16页
第二章 Web 信息挖掘系统的概要设计	第16-22页
·系统总体目标	第16页
·系统总体结构设计	第16-20页
·系统实施的技术路线	第20-21页
·本章小结	第21-22页
第三章 Web 信息挖掘系统的详细设计	第22-49页
·Web 文档的模型化设计	第22-26页
·问题分析	第23页
·表达树	第23-24页
·循环参考	第24-25页
·“弱于”	第25-26页
·最小支持度MINISUP	第26页
·文档记录分割及边界发现	第26-34页
·构造HTML 标志树	第27-30页
·数据记录边界发现方国设计	第30-34页
·Web 元数据抽取设计	第34-40页
·表的结构形式构建	第34-36页
·对象（标志）属性的作用	第36页
·规范化表的元数据抽取	第36-40页
·半结构化数据到关系数据的转换设计	第40-44页
·基本思路	第40-42页
·STORED 映射关系设计	第42-44页
·访问路径模式挖掘与用户兴趣主题发现	第44-48页
·识别一次会话（session)	第46页
·路径遍历模式发现	第46-48页
·兴趣主题发现过程设计	第48页
·小结	第48-49页
第四章 Web 信息挖掘系统的实现	第49-67页
·OEM 文档模型的表示实现	第49-51页
·组合单个启发国行文档记录分割和边界发现	第51-56页
·确定性因子	第52页
·初始化实验	第52-54页
·组合启发规则	第54-56页
·Web 元数据抽取实现	第56-57页
·STORED 映射算国的实现	第57-59页
·访问路劲模式挖掘与用户兴趣主题发现的算国实现	第59-65页
·挖掘遍历模式算国的实现	第59-61页
·大参考序列算国的实现	第61-63页
·用户兴趣主题发现的实现	第63-65页
·小结	第65-67页
第五章总结与展望	第67-69页
·全文总结	第67-68页
·展望	第68-69页
致谢	第69-70页
参考文献	第70-74页