首页--语言、文字论文--语言学论文--应用语言学论文

文本语料库的精炼研究

摘要第4-5页
Abstract第5页
第一章 绪论第8-12页
    1.1 研究背景第8-9页
    1.2 预备知识第9-12页
第二章 文本自动分类技术第12-15页
    2.1 文本预处理第12页
    2.2 建立文本索引第12页
    2.3 文本特征集的选取第12-13页
    2.4 分类方法的选择第13-14页
    2.5 分类模型的评估与选择第14页
    2.6 小结第14-15页
第三章 朴素贝叶斯算法第15-20页
    3.1 算法的假设和理论第15-16页
    3.2 算法的参数估计第16-17页
    3.3 文本数据判别时的优化第17-18页
    3.4 实验分析第18-20页
第四章 文本语料库的精炼研究第20-42页
    4.1 数据来源第20-22页
    4.2 文本语料库精炼的目的第22-23页
    4.3 文本语料库的精炼第23页
    4.4 文本数据的预处理第23-26页
    4.5 文本语料库特征词的选取第26-28页
    4.6 行业类别特征词的选取第28-33页
    4.7 第一种方法提取类别判别错误的文本数据第33-36页
    4.8 用样本文本数据对总体文本数据进行标记第36-39页
    4.9 第二种方法提取类别判别错误的文本数据第39-40页
    4.10 文本数据的校正第40-42页
第五章 总结第42-43页
参考文献第43-45页
致谢第45页

论文共45页,点击 下载论文
上一篇:不同水土保持措施对黑土坡耕地土壤侵蚀及肥力的影响
下一篇:多股流板翅式换热器的传热温差场优化研究