首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息自动标引研究

摘要第5-7页
Abstract第7-8页
第1章 绪论第14-21页
    1.1 研究背景第14-17页
    1.2 研究意义第17-19页
    1.3 研究目标与内容第19页
    1.4 论文的组织结构第19-21页
第2章 Web信息自动标引相关研究第21-35页
    2.1 Web信息采集的研究第21-23页
    2.2 Web信息抽取的研究第23-26页
    2.3 自动标引的研究第26-28页
    2.4 众多研究所涉及的算法第28-35页
第3章 Web构架分析及信息采集第35-41页
    3.1 HTML、XML和DOM第35-38页
    3.2 HTML转换为XML第38-41页
第4章 Web信息抽取关键技术:信息块判析第41-47页
    4.1 网页坐标系第41-42页
    4.2 VIPS算法第42-43页
    4.3 网页九宫格第43-44页
    4.4 网页信息去噪技术第44-47页
第5章 三种类型网站的关键信息块判定第47-68页
    5.1 新闻类站点第48-56页
        5.1.1 网站特点简介第48-49页
        5.1.2 基于不同分割比例的信息块提取实验第49-56页
    5.2 体育类站点第56-62页
        5.2.1 网站特点简介第56页
        5.2.2 基于不同分割比例的信息块提取实验第56-62页
    5.3 科学类网站第62-68页
        5.3.1 网站特点简介第62页
        5.3.2 基于不同分割比例的信息块提取实验第62-68页
第6章 标引词抽取及实现技术第68-77页
    6.1 标引词第68-69页
        6.1.1 标引词的来源第68-69页
        6.1.2 标引词的评价第69页
    6.2 科学类、新闻类网页标引源权重的探析第69-74页
        6.2.1 网页标引源权重设计第69-70页
        6.2.2 科学类站点网页各标引源表达能力统计与分析第70-73页
        6.2.3 新闻类站点网页各标引源表达能力统计与分析第73-74页
    6.3 自动标引的实现与评价第74-77页
        6.3.1 自动标引实现步骤第74-75页
        6.3.2 实验结果评价第75-77页
第7章 Web信息自动标引系统设计与实现第77-92页
    7.1 系统开发环境第77页
        7.1.1 系统硬件配置第77页
        7.1.2 系统开发软件环境第77页
    7.2 系统开发工作流程第77-79页
    7.3 系统简介第79-80页
    7.4 系统模块功能介绍第80-88页
        7.4.1 Web页面采集及预处理模块第80-81页
        7.4.2 Web页面数据处理及检验模块第81-85页
        7.4.3 数据浏览模块第85页
        7.4.4 标引模块第85-86页
        7.4.5 标引结果查询模块第86-87页
        7.4.6 参数设置模块第87页
        7.4.7 帮助模块第87-88页
    7.5 系统数据库结构第88-92页
        7.5.1 数据库设计第88-89页
        7.5.2 数据库实现第89-92页
第8章 总结与展望第92-95页
    8.1 论文工作总结第92-93页
    8.2 工作展望第93-95页
参考文献第95-104页
攻读博士学位期间主要研究成果第104-106页
致谢第106页

论文共106页,点击 下载论文
上一篇:信息融合欠驱动控制技术研究
下一篇:β淀粉样蛋白对星型胶质细胞ATP结合盒式转运蛋白的表达调控及胆固醇转运等功能改变在阿尔茨海默病中的作用