首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于表层文本信息的科技文献集多主题划分方法的研究

摘要第7-8页
Abstract第8-9页
第1章 绪论第14-22页
    1.1 研究目的和意义第14-15页
    1.2 科技文献信息处理现状第15-20页
        1.2.1 科技文献信息处理及其研究内容第15-17页
        1.2.2 科技文献的表层信息第17页
        1.2.3 文本分类技术的研究第17-19页
        1.2.4 文献集丰富性评估第19页
        1.2.5 主要存在的问题第19-20页
    1.3 研究内容与主要工作第20-21页
    1.4 本文结构第21-22页
第2章 文献分类关键技术第22-33页
    2.1 引言第22页
    2.2 文本特征选择第22-24页
    2.3 文本表示模型第24-27页
    2.4 奇异值分解和文本潜在语义标引第27-29页
    2.5 文本聚类第29-32页
        2.5.1 标准K-means算法第31页
        2.5.2 K-means类数目的确定第31-32页
    2.6 本章小结第32-33页
第3章 基于聚类的科技文献集划分与丰富性评价第33-39页
    3.1 引言第33页
    3.2 基于表层文本信息的科技文献的表示第33-35页
        3.2.1 特征词的选择第34页
        3.2.2 文本潜在语义表示模型第34-35页
    3.3 文档多主题特性标定算法第35-37页
    3.4 文献集丰富性评估第37-38页
    3.5 本章小结第38-39页
第4章 实验结果及分析第39-48页
    4.1 引言第39页
    4.2 科技文献表层信息的文字统计特性第39-41页
    4.3 特征词选择第41-42页
    4.4 SVD奇异值选择第42-43页
    4.5 多主题聚类第43-46页
        4.5.1 类数目第44页
        4.5.2 聚类模糊化第44-45页
        4.5.3 聚类结果与人工分类对比分析第45-46页
    4.6 文献集丰富性评估第46-47页
    4.7 本章小结第47-48页
结论第48-49页
参考文献第49-53页
攻读硕士学位期间发表的论文第53-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:PHC超长管桩承载力与影响因素应用研究--以山西省长治地区建设项目为例
下一篇:图像及视频作品版权识别技术研究