首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于区域块密度的网页信息抽取技术在移动网站开发中的研究与实现

摘要第5-7页
Abstract第7-8页
绪论第12-22页
    1.1 课题研究背景和意义第12-14页
    1.2 国内外发展现状第14-18页
    1.3 研究思路及内容第18-19页
    1.4 论文组织结构第19-22页
2. 网页信息抽取概念及相关技术介绍第22-30页
    2.1 网页信息抽取概念第22页
    2.2 网页信息抽取技术关键步骤第22-23页
    2.3 网页信息抽取相关技术介绍第23-29页
        2.3.1 基于网页视觉特征的网页信息抽取技术第23页
        2.3.2 基于 DOM 树的网页信息抽取技术第23-24页
        2.3.3 基于包装器的网页信息抽取技术第24-25页
        2.3.4 基于 XSLT 模板的网页信息抽取技术第25-29页
    2.4 网页信息抽取评价标准第29页
    2.5 本章小结第29-30页
3. 网页信息抽取流程建模第30-36页
    3.1 网页类型分类第30-31页
    3.2 URL 相似度匹配第31-33页
    3.3 网页类型判断第33-34页
    3.4 网页抽取流程第34-35页
    3.5 本章小结第35-36页
4. 基于区域块密度的网页正文抽取算法第36-44页
    4.1 算法的原理及流程第36-40页
        4.1.1 网页预处理第37-38页
        4.1.2 区域块密度函数第38-40页
    4.2 阈值学习第40-41页
    4.3 实验结果及分析第41-43页
        4.3.1 实验方法第41-42页
        4.3.2 结果分析第42-43页
    4.4 本章小结第43-44页
5. 移动网站开发平台的设计与实现第44-58页
    5.1 平台简介第44-45页
    5.2 平台目标第45-46页
    5.3 平台系统架构第46-48页
    5.4 平台关键模块第48-53页
        5.4.1 网页源码获取与预处理模块第48-49页
        5.4.2 网页类型判别模块第49-50页
        5.4.3 网页抽取模块第50-51页
        5.4.4 网页缓存模块第51-52页
        5.4.5 网页渲染模块第52-53页
    5.5 运行测试第53-54页
    5.6 运行效果演示第54-56页
    5.7 本章小结第56-58页
6. 总结与展望第58-60页
    6.1 论文工作总结第58页
    6.2 未来研究展望第58-60页
参考文献第60-64页
致谢第64-66页
个人简历第66页
研究成果第66-67页

论文共67页,点击 下载论文
上一篇:Web服务组合可靠性优化方法研究与实现
下一篇:IPv4/IPv6共存自治域中网络拓扑发现的研究和实现