首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本宏特征抽取与基于质心的自动分类方法研究

摘要第4-6页
ABSTRACT第6-7页
第1章 绪论第14-29页
    1.1 课题背景及意义第14-16页
    1.2 文本分类语料库的构建方法研究第16-18页
    1.3 文本特征抽取研究现状第18-20页
    1.4 文本分类方法研究现状第20-24页
        1.4.1 无监督文本分类方法第20-21页
        1.4.2 有监督文本分类方法第21-22页
        1.4.3 半监督文本分类方法第22-24页
    1.5 文本分类评测指标第24-25页
    1.6 本文的研究内容及创新点第25-27页
        1.6.1 研究内容概述第25-27页
        1.6.2 主要创新点第27页
    1.7 论文组织结构第27-29页
第2章 基于网页结构的语料库自动构建方法第29-51页
    2.1 引言第29-30页
    2.2 语料库自动构建方法框架第30-31页
    2.3 网页类别自动标注方法第31-39页
        2.3.1 导航栏识别过程第32-33页
        2.3.2 导航栏识别方法第33-38页
        2.3.3 链接类别自动标注方法第38-39页
    2.4 语料库生成第39-41页
        2.4.1 网页内容提取第39-40页
        2.4.2 网页语言分类第40-41页
    2.5 基于文本聚类的语料库降噪第41-44页
        2.5.1 基于K-means聚类的语料库降噪第42页
        2.5.2 基于LDA主题模型的语料库降噪第42-44页
    2.6 实验第44-50页
        2.6.1 实验数据第44页
        2.6.2 实验设置第44-45页
        2.6.3 实验结果第45-50页
    2.7 本章小结第50-51页
第3章 有监督文本宏特征抽取方法第51-73页
    3.1 引言第51-52页
    3.2 文本聚类算法第52-54页
        3.2.1 K-means聚类算法第52-53页
        3.2.2 层次聚类算法第53页
        3.2.3 AP聚类算法第53-54页
    3.3 距离函数和相似度度量方法第54-56页
        3.3.1 距离函数第54-55页
        3.3.2 相似度度量方法第55-56页
    3.4 基于聚类的有监督宏特征抽取第56-58页
        3.4.1 基于聚类的有监督宏特征抽取原理第56-57页
        3.4.2 基于聚类的有监督宏特征抽取算法第57-58页
    3.5 基于聚类加权的有监督宏特征抽取第58-62页
        3.5.1 基于聚类加权的有监督宏特征抽取原理第58-60页
        3.5.2 基于聚类加权的有监督宏特征抽取算法第60-62页
    3.6 基于质心向量的有监督宏特征抽取第62-64页
        3.6.1 基于质心向量的有监督宏特征抽取原理第62页
        3.6.2 基于质心向量的有监督宏特征抽取算法第62-64页
    3.7 实验第64-72页
        3.7.1 实验数据第64页
        3.7.2 实验设置第64-65页
        3.7.3 实验结果第65-72页
    3.8 本章小结第72-73页
第4章 文本宏特征融合方法第73-84页
    4.1 引言第73页
    4.2 文本的描述模型第73-74页
    4.3 无监督宏特征第74-77页
        4.3.1 基于K-means的无监督宏特征抽取第74页
        4.3.2 基于LDA的无监督宏特征抽取第74-76页
        4.3.3 基于DBN的无监督宏特征抽取第76-77页
    4.4 有监督和无监督宏特征融合第77-79页
    4.5 实验第79-83页
        4.5.1 实验数据和设置第79页
        4.5.2 实验结果第79-83页
    4.6 本章小结第83-84页
第5章 基于排序学习框架的质心文本分类方法第84-105页
    5.1 引言第84-85页
    5.2 基于质心的分类方法第85-87页
        5.2.1 Rocchio方法第85-86页
        5.2.2 Hypothesis Margin Centroid方法第86页
        5.2.3 Drag Pushing方法第86-87页
    5.3 基于排序学习的质心分类方法的统一框架第87-90页
        5.3.1 基于排序学习的统一框架第87-88页
        5.3.2 基于质心的分类方法的框架表示第88-90页
    5.4 基于排序学习的质心分类方法第90-96页
        5.4.1 基于Pointwise排序的质心方法第90-92页
        5.4.2 基于Pairwise排序的质心方法第92-94页
        5.4.3 基于Listwise排序的质心方法第94-96页
    5.5 实验第96-104页
        5.5.1 实验数据第96-97页
        5.5.2 实验设置第97-98页
        5.5.3 实验结果第98-104页
    5.6 本章小结第104-105页
结论第105-107页
参考文献第107-119页
攻读博士学位期间发表的学术论文及其它成果第119-121页
致谢第121-122页
个人简历第122页

论文共122页,点击 下载论文
上一篇:丙型肝炎病毒NS5B RNA聚合酶抑制性多肽筛选
下一篇:具有扩散—波动调和特性的图像去噪方法