首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

就业垂直搜索引擎的架构与实现

摘要第8-9页
ABSTRACT第9-10页
第1章 绪论第11-17页
    1.1 课题研究背景及研究意义第11-13页
        1.1.1 研究背景第11-12页
        1.1.2 研究意义第12-13页
    1.2 搜索引擎与垂直搜索引擎第13-15页
        1.2.1 搜索引擎第13页
        1.2.2 搜索引擎的分类第13-14页
        1.2.3 垂直搜索引擎第14-15页
    1.3 本文的研究内容第15-16页
    1.4 论文章节安排第16-17页
第2章 就业垂直搜索引擎的相关技术第17-29页
    2.1 信息采集技术详解第17-20页
        2.1.1 网络爬虫的基本概念第17-18页
        2.1.2 通用网络爬虫第18-19页
        2.1.3 聚焦网络爬虫第19-20页
    2.2 信息抽取技术详解第20-24页
        2.2.1 网页去噪技术详解第20-22页
        2.2.2 网页结构化信息抽取第22-24页
    2.3 索引检索模块详解第24-29页
        2.3.1 Lucene全文检索框架第24-25页
        2.3.2 中文分词第25-27页
        2.3.3 Lucene中自带的分词器第27-28页
        2.3.4 中文分词算法及工具包第28-29页
第3章 信息采集模块的设计与实现第29-36页
    3.1 列表页爬虫第29-33页
        3.1.1 列表页爬虫的设计第29-30页
        3.1.2 列表页爬虫的实现第30-33页
    3.2 信息页爬虫第33-36页
第4章 信息抽取模块的分析与详细设计第36-48页
    4.1 网页去噪第36-43页
        4.1.1 基本概念第36-38页
        4.1.2 HTML Parser第38-39页
        4.1.3 基于标签类别的网页去噪算法第39-43页
    4.2 结构化信息抽取第43-48页
第5章 索引检索模块的分析与详细设计第48-55页
    5.1 职位信息索引第48-50页
        5.1.1 索引的建立过程第48-50页
        5.1.2 中文分词器的选择第50页
    5.2 职位信息检索第50-51页
        5.2.1 全文检索第50-51页
        5.2.2 高级检索第51页
    5.3 职位信息索引模块的实现第51-52页
    5.4 职位信息检索模块的实现第52-55页
第6章 就业垂直搜索引擎的原型系统第55-58页
第7章 总结与展望第58-61页
    7.1 论文工作总结第58页
    7.2 本文主要工作和贡献第58-59页
    7.3 论文的不足第59页
    7.4 展望进一步的工作第59-61页
参考文献第61-64页
致谢第64-65页
附件第65页

论文共65页,点击 下载论文
上一篇:基于.net的某银行客户关系管理系统的设计与实现
下一篇:图书营销信息管理系统的设计与实现