首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本挖掘技术的研究与应用

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-14页
第一章 绪论第14-20页
    1.1 选题背景和意义第14-15页
    1.2 国内外研究现状第15-16页
    1.3 本文研究内容第16-17页
    1.4 论文结构第17-20页
第二章 文本挖掘技术简介第20-28页
    2.1 文本挖掘技术第20-22页
        2.1.1 文本挖掘的概念第20-21页
        2.1.2 文本挖掘的任务第21-22页
    2.2 文本挖掘的工作过程第22-23页
    2.3 文本分类算法研究第23-27页
        2.3.1 KNN分类算法第23-24页
        2.3.2 Rocchio分类算法第24-25页
        2.3.3 朴素贝叶斯分类算法第25-26页
        2.3.4 决策树分类算法第26页
        2.3.5 神经网络分类算法第26页
        2.3.6 支持向量机分类算法第26-27页
    2.4 小结第27-28页
第三章 文本预处理第28-38页
    3.1 文本表示第28-29页
    3.2 中文分词技术第29-31页
        3.2.1 基于词典的分词方法第29-30页
        3.2.2 基于统计的分词方法第30页
        3.2.3 基于理解的分词方法第30-31页
        3.2.4 中文分词开源项目第31页
    3.3 文本特征选择第31-35页
        3.3.1 词频统计第32页
        3.3.2 TF-IDF方法第32-33页
        3.3.3 期望交叉熵第33页
        3.3.4 χ2(CHI)统计第33页
        3.3.5 互信息第33-34页
        3.3.6 文本相似性度量第34-35页
    3.4 改进特征选择方法第35-36页
        3.4.1 改进TF-IDF方法第35-36页
        3.4.2 基于义原的特征选择方法第36页
    3.5 小结第36-38页
第四章 基于特征义原的文本分类方法第38-50页
    4.1 预处理第38页
    4.2 创建原始向量空间模型第38-42页
        4.2.1 特征项表示方法第39-40页
        4.2.2 获得类中心向量第40-42页
    4.3 扩展向量空间模型第42-46页
        4.3.1 获取义原文档第42-43页
        4.3.2 提取特征义原第43-44页
        4.3.3 扩展特征向量第44-45页
        4.3.4 对同义词的处理第45页
        4.3.5 VSM模型的融合第45-46页
    4.4 文本分类第46-47页
    4.5 确定阈值第47页
    4.6 小结第47-50页
第五章 实验过程与结果分析第50-58页
    5.1 实验环境第50页
    5.2 评估指标第50-51页
    5.3 实验过程第51-52页
    5.4 实验结果与分析第52-56页
        5.4.1 特征选择算法对分类的影响第52-54页
        5.4.2 VSM维数对分类的影响第54-55页
        5.4.3 基于扩展VSM的文本分类第55-56页
    5.5 小结第56-58页
第六章 总结与展望第58-60页
    6.1 工作总结第58-59页
    6.2 工作展望第59-60页
参考文献第60-64页
致谢第64-66页
作者简介第66-67页

论文共67页,点击 下载论文
上一篇:基于城市更新理论的城市“三旧”改造政策研究--以福建宁德市为例
下一篇:半导体工业洁净室新风系统节能方法研究