首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

全文检索系统中文件预处理技术研究

摘要第5-6页
ABSTRACT第6-7页
第1章 绪论第11-17页
    1.1 研究背景第11-12页
    1.2 国内外研究现状第12-15页
    1.3 研究内容第15-16页
    1.4 章节安排第16-17页
第2章 相关技术综述第17-31页
    2.1 引言第17页
    2.2 分布式全文检索系统第17-21页
        2.2.1 索引和检索技术第18-19页
        2.2.2 文件预处理技术第19-21页
    2.3 消息队列系统相关技术第21-24页
        2.3.1 生产者消费者模型第21页
        2.3.2 消息队列模式第21-22页
        2.3.3 常用消息队列第22-24页
    2.4 文件分类识别系统相关技术第24-29页
        2.4.1 文件类型识别第24-27页
        2.4.2 文件分类方法第27-28页
        2.4.3 分类性能评估方法第28-29页
    2.5 本章小结第29-31页
第3章 文本内容提取消息队列设计第31-43页
    3.1 引言第31页
    3.2 消息队列设计第31-35页
        3.2.1 基本组成第31-33页
        3.2.2 消息应答机制第33页
        3.2.3 调度分配策略第33-34页
        3.2.4 持久化设置第34-35页
    3.3 消息队列实现第35-37页
    3.4 系统自启动第37-39页
    3.5 测试及结果分析第39-41页
        3.5.1 实验平台第39页
        3.5.2 实验结果及分析第39-41页
    3.6 本章小结第41-43页
第4章 基于主成分分析和K近邻的文件类型识别第43-57页
    4.1 引言第43页
    4.2 文件表示模型第43-46页
    4.3 降维处理第46-49页
        4.3.1 文件内容截取算法第47页
        4.3.2 主成分分析算法第47-48页
        4.3.3 聚类算法第48-49页
    4.4 算法实现第49-55页
        4.4.1 算法描述第49-50页
        4.4.2 算法测试第50-51页
        4.4.3 实验结果分析第51-55页
    4.6 本章小结第55-57页
第5章 基于SVM的文件类型识别算法第57-73页
    5.1 引言第57页
    5.2 特征权重计算第57-61页
        5.2.1 特征权重计算方法分析第57-58页
        5.2.2 特征权重计算方法改进第58-61页
    5.3 特征选择方法第61-63页
        5.3.1 信息增益特征选择方法分析第61-62页
        5.3.2 信息增益特征选择方法改进第62-63页
    5.4 SVM理论第63-66页
        5.4.1 最优分类超平面第63-64页
        5.4.2 广义最优分类超平面第64-65页
        5.4.3 核函数第65-66页
        5.4.4 多类分类问题第66页
    5.5 基于SVM的文件分类算法分析第66-72页
        5.5.1 算法描述第66-69页
        5.5.2 算法实现第69-70页
        5.5.3 测试及结果分析第70-72页
    5.6 本章小结第72-73页
第6章 总结与展望第73-75页
    6.1 本文工作总结第73页
    6.2 研究展望第73-75页
参考文献第75-79页
致谢第79-81页
在读期间发表的学术论文与取得的其他研究成果第81页

论文共81页,点击 下载论文
上一篇:反应箍缩等离子体常用微波诊断可行性分析
下一篇:基于视觉1-Point RANSAC EKF-SLAM的大肠微型机器人内镜定位