首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web信息挖掘的研究及应用

摘要第1-5页
ABSTRACT第5-8页
第一章 绪论第8-16页
   ·研究背景第8-9页
   ·Web 信息抽取与挖掘的研究现状第9-15页
     ·数据模型第10-11页
     ·查询语言第11-13页
     ·Web 文档页的数据抽取第13-15页
   ·本文的主要工作第15-16页
第二章 Web 信息挖掘系统的概要设计第16-22页
   ·系统总体目标第16页
   ·系统总体结构设计第16-20页
   ·系统实施的技术路线第20-21页
   ·本章小结第21-22页
第三章 Web 信息挖掘系统的详细设计第22-49页
   ·Web 文档的模型化设计第22-26页
     ·问题分析第23页
     ·表达树第23-24页
     ·循环参考第24-25页
     ·“弱于”第25-26页
     ·最小支持度MINISUP第26页
   ·文档记录分割及边界发现第26-34页
     ·构造HTML 标志树第27-30页
     ·数据记录边界发现方国设计第30-34页
   ·Web 元数据抽取设计第34-40页
     ·表的结构形式构建第34-36页
     ·对象(标志)属性的作用第36页
     ·规范化表的元数据抽取第36-40页
   ·半结构化数据到关系数据的转换设计第40-44页
     ·基本思路第40-42页
     ·STORED 映射关系设计第42-44页
   ·访问路径模式挖掘与用户兴趣主题发现第44-48页
     ·识别一次会话(session)第46页
     ·路径遍历模式发现第46-48页
     ·兴趣主题发现过程设计第48页
   ·小结第48-49页
第四章 Web 信息挖掘系统的实现第49-67页
   ·OEM 文档模型的表示实现第49-51页
   ·组合单个启发国行文档记录分割和边界发现第51-56页
     ·确定性因子第52页
     ·初始化实验第52-54页
     ·组合启发规则第54-56页
   ·Web 元数据抽取实现第56-57页
   ·STORED 映射算国的实现第57-59页
   ·访问路劲模式挖掘与用户兴趣主题发现的算国实现第59-65页
     ·挖掘遍历模式算国的实现第59-61页
     ·大参考序列算国的实现第61-63页
     ·用户兴趣主题发现的实现第63-65页
   ·小结第65-67页
第五章 总结与展望第67-69页
   ·全文总结第67-68页
   ·展望第68-69页
致谢第69-70页
参考文献第70-74页

论文共74页,点击 下载论文
上一篇:糖尿病信息管理系统的开发与应用
下一篇:视频文字提取技术研究与应用