首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

概率数据检索、挖掘及多层文本分类问题的研究

插图索引第6-7页
表格索引第7-8页
摘要第8-10页
Abstract第10-11页
第一章 绪论第12-28页
    摘要第12页
    1.1. 引言第12-13页
    1.2. 相关技术概述第13-22页
        1.2.1. 数据索引技术第13-16页
        1.2.2. 数据检索及挖掘第16-21页
        1.2.3. 应用及研究意义第21-22页
    1.3. 本文工作及创新第22-23页
    1.4. 本文组织与结构第23-24页
    参考文献第24-28页
第二章 研究背景与相关工作第28-44页
    摘要第28页
    2.1. 概率数据语义模型第28-30页
        2.1.1. 现有语义模型比较第28-29页
        2.1.2. 可能世界语义模型第29-30页
    2.2. 文本检索与分类第30-39页
        2.2.1. 特征选择第30-33页
        2.2.2. 索引方法第33-35页
        2.2.3. 检索模型第35-36页
        2.2.4. 分类算法第36-37页
        2.2.5. 性能评估第37-39页
    2.3. 小结第39页
    参考文献第39-44页
第三章 概率空间数据的文本检索技术研究第44-69页
    摘要第44页
    3.1. 引言第44-45页
    3.2. 相关研究进展第45-46页
    3.3. 问题陈述第46-49页
        3.3.1. 研究动机第46-48页
        3.3.2. 基本定义第48-49页
    3.4. 检索语义第49-53页
        3.4.1. 两步检索框架第49-50页
        3.4.2. 现有检索语义比较第50-51页
        3.4.3. top-(c,k)检索语义第51-53页
    3.5. 增量得分计算方法第53-56页
        3.5.1. IRTree索引结构第53-55页
        3.5.2. ISA 算法第55-56页
    3.6. 参数化概率排序算法PRANK~c第56-60页
        3.6.1. 基本算法PRank~c第56-58页
        3.6.2. 优化策略第58-59页
        3.6.3. 参数估计第59-60页
    3.7. 实验结果和分析第60-66页
        3.7.1. 实验环境搭建第60-61页
        3.7.2. 相似度函数选择第61-63页
        3.7.3. 验证参数c的必要性第63页
        3.7.4. 验证top-(c,k)检索模式性能第63-65页
        3.7.5. 验证优化策略的有效性第65页
        3.7.6. 验证检索时间性能第65-66页
    3.8. 小结第66页
    参考文献第66-69页
第四章 概率数据的频繁项集挖掘技术研究第69-86页
    摘要第69页
    4.1. 引言第69-70页
    4.2. 相关研究进展第70-71页
        4.2.1. 传统的频繁项集挖掘技术第70-71页
        4.2.2. 不确定数据上频繁项集挖掘技术第71页
    4.3. 概率频繁项集的语义第71-76页
        4.3.1. 基本定义第71-73页
        4.3.2. 概率事务语义解释第73-74页
        4.3.3. 两种语义对比分析第74-76页
        4.3.4. 概率频繁项集的性质第76页
    4.4. 概率频繁项集挖掘方法第76-80页
        4.4.1. 候选项集判定方法第76-78页
        4.4.2. 增量式概率频繁项集挖掘方法第78-80页
    4.5. 实验分析第80-83页
        4.5.1. 实验环境搭建第80-81页
        4.5.2. 测试项目概率分布敏感性第81页
        4.5.3. 测试挖掘参数的影响第81-83页
        4.5.4. 测试可伸缩性第83页
    4.6. 小结第83页
    参考文献第83-86页
第五章 多层文本分类技术研究第86-101页
    摘要第86页
    5.1. 引言第86-87页
    5.2. 背景知识及研究进展第87-91页
        5.2.1. 文本表示模型第87-88页
        5.2.2. 文本分类器第88-89页
        5.2.3. 样本集构建方法第89-90页
        5.2.4. 相关研究进展第90-91页
    5.3. 数据偏斜平衡方法第91-93页
        5.3.1. 路径语义向量表示第91-92页
        5.3.2. 训练样本增强策略第92-93页
    5.4. 错误传播降低与纠正第93-96页
        5.4.1. 降低错误传播第94-95页
        5.4.2. 纠正错误传播第95-96页
        5.4.3. 多层文本分类算法第96页
    5.5. 实验第96-99页
        5.5.1. 实验设置第96页
        5.5.2. 验证数据偏斜平衡策略的有效性第96-97页
        5.5.3. 验证错误传播纠正策略的有效性第97-98页
        5.5.4. 验证多层文本分类算法的性能第98-99页
    5.6. 小结第99页
    参考文献第99-101页
第六章 总结及展望第101-103页
    摘要第101页
    6.1 总结第101-102页
    6.2 展望第102-103页
致谢第103-104页
附录A 攻读博士学位期间发表(录用)论文情况第104页
附录B 攻读博士学位期间获奖和参加科研学术活动情况第104-106页

论文共106页,点击 下载论文
上一篇:电纺SiOC纤维及其复合材料的结构调控与性能研究
下一篇:三维集成电路硅通孔匹配和倒装芯片布线算法研究