首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

新闻垂直搜索引擎中文分词与网页去重的应用与研究

摘要第4-5页
Abstract第5页
第一章 绪论第8-13页
    1.1 课题研究背景及意义第8-9页
    1.2 国内外的研究现状第9-11页
    1.3 目前存在的问题第11-12页
    1.4 研究的目标和内容第12-13页
        1.4.1 研究目标第12页
        1.4.2 研究内容第12-13页
第二章 垂直搜索引擎的关键技术第13-19页
    2.1 垂直搜索引擎工作原理第13-14页
    2.2 网络爬虫技术第14-16页
        2.2.1 网络爬虫的特点第14-15页
        2.2.2 网络爬虫的工作原理第15页
        2.2.3 爬虫搜索策略和算法第15-16页
    2.3 中文分词技术第16-17页
    2.4 网页去重技术第17-18页
    2.5 本章小结第18-19页
第三章 新闻垂直搜索引擎的的总体方案设计第19-24页
    3.1 系统的需求分析第19-20页
    3.2 系统设计要求第20-21页
    3.3 系统功能模块设计第21-23页
        3.3.1 系统工作原理第21-22页
        3.3.2 系统功能模块设计结构图第22-23页
    3.4 本章小结第23-24页
第四章 新闻垂直搜索引擎系统的设计与实现第24-57页
    4.1 网络爬虫子系统的设计与实现第24-30页
        4.1.1 网络爬虫的子系统的技术分析第24-26页
        4.1.2 网络爬虫的实现第26-30页
    4.2 网页提取模块设计第30-37页
        4.2.1 网页提取模块技术分析第30-31页
        4.2.2 网页提取算法设计第31-32页
        4.2.3 网页提取模块的实现第32-37页
    4.3 分词模块设计第37-45页
        4.3.1 分词模块技术分析第37-38页
        4.3.2 分词算法的设计第38-40页
        4.3.3 分词算法的实现第40-45页
    4.4 网页去重设计第45-52页
        4.4.1 网页去重模块技术分析第45-46页
        4.4.2 网页去重算法设计第46-47页
        4.4.3 网页去重模块的实现第47-52页
    4.5 索引模块设计第52-56页
        4.5.1 索引模块技术分析第52-53页
        4.5.2 索引模块系统实现第53-56页
    4.6 本章小结第56-57页
第五章 新闻垂直搜索引擎的试验结果第57-66页
    5.1 系统开发平台第57页
    5.2 网页提取模块试验结果及分析第57-59页
    5.3 索引建立试验结果第59页
    5.4 中文分词试验第59-61页
    5.5 去重模块试验第61-63页
    5.6 程序最终运行结果第63-64页
    5.7 本章小结第64-66页
第六章 结论与展望第66-68页
    6.1 结论第66-67页
    6.2 工作展望第67-68页
参考文献第68-72页
攻读硕士学位期间取得的研究成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于体感人机交互方法的心理宣泄系统设计
下一篇:形态学分水岭结合谱聚类的图像分割算法