首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题特征的Web信息挖掘模型的研究与实现

摘要第1-5页
ABSTRACT第5-10页
第一章 绪论第10-14页
     ·研究背景和意义第10-11页
     ·国内外现状第11-12页
     ·论文的主要工作第12页
     ·本文组织结构第12-14页
第二章 Web信息挖掘和主题特征的研究第14-21页
     ·Web信息挖掘第14-15页
       ·Web结构挖掘第14页
       ·Web内容挖掘第14-15页
       ·Web使用挖掘第15页
     ·主题特征归纳第15-19页
       ·主题描述特征第15-16页
       ·主题网页特征第16-18页
       ·链接特征第18-19页
     ·主题站点垂直挖掘模型研究第19-20页
     ·本章小结第20-21页
第三章 基于URL特征的网站结构信息挖掘第21-36页
     ·相关研究发展状况第21页
     ·网站结构特征研究第21-25页
       ·网站的结构研究第21-23页
       ·网站内的单个页面结构特征分析第23-24页
       ·网站的全局特征分析第24-25页
     ·URL特征研究第25-27页
       ·URL介绍第25-26页
       ·URL特征分析第26-27页
     ·基于URL特征的网站结构挖掘第27-35页
       ·三元组URL描述法第27-28页
       ·URL树第28页
       ·URL链接解析第28-29页
       ·网站三元组URL树第29-31页
       ·基于三元组URL树的网站信息挖掘第31-35页
     ·本章小结第35-36页
第四章 中文网页正文内容抽取方法的研究与实现第36-46页
     ·相关研究发展状况第36-37页
     ·网页标题抽取方法的研究第37-39页
       ·锚文本和标题的相似度分析第37页
       ·标题的自然语言规则研究第37-38页
       ·基于多条件决策的网页正文标题抽取方法流程第38-39页
     ·标题和正文依存距离研究第39-41页
       ·依存树模型分析第39页
       ·网页解析第39-41页
     ·基于TCDT的中文网页正文抽取方法第41-43页
       ·正文节点统计特性第41页
       ·依存距离模型分析第41-43页
     ·基于TCDT的中文网页正文抽取方法流程第43-44页
     ·实验结果第44-45页
     ·本章小结第45-46页
第五章 Web网页细粒度信息抽取方法的研究第46-63页
     ·相关研究发展状况第46-47页
     ·网页粒度理论研究第47-51页
       ·网页粒度理论第47-48页
       ·网页结构特征分析第48-51页
     ·网页属性化思想第51-53页
       ·网页文本特征研究第51-52页
       ·网页属性项文本第52-53页
     ·基于语义和规则的网页细粒度信息抽取模型第53-54页
     ·语义解析模块第54-57页
       ·语义词典的构造第54-55页
       ·相似度计算公式第55-57页
     ·网页属性项抽取第57-62页
       ·属性项文本和自由文本预处理第57-58页
       ·属性项文本抽取属性项第58-60页
       ·段落中抽取属性项第60-62页
     ·本章小结第62-63页
第六章 站点垂直挖掘系统的实现第63-73页
     ·站点垂直挖掘系统设计第63-65页
       ·需求分析第63页
       ·站点垂直挖掘系统整体设计第63-65页
     ·基于三元组URL描述法的结构挖掘实现第65-68页
       ·招标URL页面分类步骤第65-67页
       ·实验结果第67-68页
     ·基于语义和规则的内容挖掘模块的实现第68-72页
       ·招标词典构造和抽取规则制定第68-70页
       ·实验结果第70-72页
     ·本章小结第72-73页
第七章 总结与展望第73-75页
     ·总结第73页
     ·展望第73-75页
参考文献第75-79页
致谢第79-80页
攻读学位期间发表的学术论文目录第80页

论文共80页,点击 下载论文
上一篇:面向Linux的涉密机违规外联监控系统
下一篇:面向云的高性能漏洞扫描引擎模块的设计与实现