首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于词典与统计结合的中文分词方法研究及全文检索系统设计

摘要第6-7页
Abstract第7-8页
1. 绪论第11-18页
    1.1 研究背景与意义第11-12页
    1.2 国内外研究现状第12-15页
        1.2.1 全文检索技术的发展及应用第12-13页
        1.2.2 中文分词技术第13-14页
        1.2.3 总结分析第14-15页
    1.3 研究内容与方法第15-17页
        1.3.1 研究目标与内容第15页
        1.3.2 研究方法与技术路线第15-17页
    1.4 论文的组织结构第17-18页
2. 全文检索相关技术第18-28页
    2.1 全文检索第18-19页
        2.1.1 全文检索简介第18页
        2.1.2 全文检索框架第18-19页
    2.2 全文索引模型第19-23页
        2.2.1 位图及署名文件模型第19-20页
        2.2.2 倒排表模型第20-21页
        2.2.3 后缀树模型第21-23页
        2.2.4 全文索引模型评价第23页
    2.3 检索模型第23-28页
        2.3.1 布尔检索模型第24页
        2.3.2 向量空间模型第24-25页
        2.3.3 概率模型第25-28页
3. 中文分词算法第28-45页
    3.1 中文分词简介第28-29页
        3.1.1 中文分词难点第28-29页
        3.1.2 中文分词算法第29页
    3.2 基于词典的中文分词方法第29-34页
        3.2.1 词典分词第29-32页
        3.2.2 词典机制第32-34页
    3.3 基于统计的分词方法第34-39页
        3.3.1 互信息模型第34-35页
        3.3.2 N-gram模型第35-36页
        3.3.3 隐马尔科夫模型第36-37页
        3.3.4 条件随机场第37-39页
    3.4 基于词典与统计结合的中文分词方法第39-43页
        3.4.1 本文分词算法设计第39-40页
        3.4.2 实验结果及分析第40-43页
    3.5 分词算法比较与评价第43-45页
4. 资源库全文检索系统设计第45-56页
    4.1 全文检索框架Lucene第45-48页
        4.1.1 Lucene索引结构第46-47页
        4.1.2 Lucene检索过程第47-48页
        4.1.3 Lucene分析器第48页
    4.2 武当山资源库概述第48-49页
    4.3 全文检索系统设计第49-56页
        4.3.1 功能设计第49-50页
        4.3.2 文档录入与提取模块设计第50-51页
        4.3.3 索引模块设计第51-54页
        4.3.4 查询模块设计第54-55页
        4.3.5 结果分析第55-56页
5. 总结与展望第56-57页
    5.1 总结第56页
    5.2 展塑第56-57页
参考文献第57-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:四逆汤的谱动学与谱效学研究
下一篇:环维黄杨星D纳米粒的制备与脑靶向性评价