首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本挖掘中若干关键技术研究

摘要第5-7页
ABSTRACT第7-8页
第一章 绪论第12-26页
    1.1 研究背景第12-15页
        1.1.1 文本挖掘概述第12-13页
        1.1.2 文本挖掘的研究内容第13页
        1.1.3 文本挖掘的历史发展第13-14页
        1.1.4 农业文本信息挖掘第14-15页
    1.2 文本挖掘的研究现状第15-22页
        1.2.1 文本分类第16-20页
        1.2.2 文本摘要第20-21页
        1.2.3 正例和未标注文本分类第21-22页
    1.3 本文的研究内容及主要创新点第22-25页
        1.3.1 本文的主要研究工作第22-23页
        1.3.2 研究方法与技术路线第23-24页
        1.3.3 本文的主要创新点第24-25页
    1.4 本文的组织结构第25-26页
第二章 文本分类相关技术第26-43页
    2.1 文本分类第26-33页
        2.1.1 文本预处理第26页
        2.1.2 文本表示第26-28页
        2.1.3 文本特征选择第28-29页
        2.1.4 特征权重计算第29-30页
        2.1.5 文本分类方法第30-33页
    2.2 正例和未标注文本分类第33-40页
        2.2.1 基于两阶段策略的正例和未标注学习第34-38页
        2.2.2 基于正例统计学习模型的方法第38-39页
        2.2.3 基于负例偏置的方法第39-40页
    2.3 性能评价第40-42页
        2.3.1 文本分类评价指标第40-41页
        2.3.2 文本自动摘要评价指标第41-42页
    2.4 本章小结第42-43页
第三章 基于概率密度估计的正例和未标注文本学习第43-62页
    3.1 引言第43-44页
    3.2 问题定义第44-45页
    3.3 PDE-KNN算法第45-48页
        3.3.1 算法理论第45-46页
        3.3.2 PDE-KNN算法描述第46-48页
    3.4 实验分析第48-61页
        3.4.1 实验设计第48-49页
        3.4.2 PDE-KNN抽取可靠负例个数比较第49-51页
        3.4.3 分类性能比较第51-57页
        3.4.4 PDE_KNN算法参数分析第57-61页
    3.5 本章小结第61-62页
第四章 基于期望最大估计的正例和未标注文本贝叶斯学习第62-84页
    4.1 引言第62页
    4.2 问题定义第62-64页
    4.3 EM-PUL算法第64-70页
    4.4 算法收敛性证明第70-71页
    4.5 实验分析第71-83页
        4.5.1 实验设计第71-72页
        4.5.2 实验结果比较分析第72-81页
        4.5.3 算法参数分析第81-83页
    4.6 本章小结第83-84页
第五章 基于非负矩阵分解的正例和未标注网络式文本学习第84-98页
    5.1 引言第84-85页
    5.2 相关研究第85-86页
    5.3 问题定义第86页
    5.4 正例和未标注网络文本学习第86-90页
        5.4.1 NMF用于文本类别簇的发现第86-87页
        5.4.2 正例和未标注学习第87-89页
        5.4.3 目标函数第89页
        5.4.4 优化算法第89-90页
    5.5 pu Net算法描述第90-91页
    5.6 实验分析第91-97页
        5.6.1 实验设计第91-93页
        5.6.2 实验比较和结果分析第93-94页
        5.6.3 算法收敛性分析第94-95页
        5.6.4 算法参数分析第95-97页
        5.6.5 算法时间复杂度分析第97页
    5.7 本章小结第97-98页
第六章 基于图排序的多文档自动摘要第98-109页
    6.1 引言第98页
    6.2 相关研究第98-99页
    6.3 基于图排序的多文档摘要第99-102页
        6.3.1 问题定义第99-100页
        6.3.2 正则化框架第100-102页
        6.3.3 句子抽取和冗余消除第102页
    6.4 实验与评测第102-108页
        6.4.1 与DUC参赛系统比较第103-105页
        6.4.2 T检验第105-106页
        6.4.3 生成摘要示例第106-108页
    6.5 结论第108-109页
第七章 结论与展望第109-111页
参考文献第111-120页
致谢第120-121页
作者简介第121页

论文共121页,点击 下载论文
上一篇:新型电学层析成像技术及其应用研究
下一篇:基于检测与跟踪互反馈的多目标跟踪技术及应用研究