首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向专业领域的文本特征提取技术研究

摘要第1-10页
ABSTRACT第10-11页
第一章 绪论第11-18页
   ·课题背景第11-12页
   ·文本特征提取概述第12-16页
     ·定义第12-13页
     ·文本特征的表示方法第13-14页
     ·文本特征提取的过程第14-15页
     ·相关研究第15-16页
   ·课题研究内容第16-17页
   ·论文结构第17-18页
第二章 面向文本特征提取的分词算法第18-36页
   ·中文分词介绍第18-21页
     ·基于词典的分词方法第18-19页
     ·基于理解的分词方法第19-20页
     ·基于统计的分词方法第20页
     ·基于语义的分词方法第20-21页
   ·常用分词算法的不足第21-26页
     ·特征词的特点分析第22-23页
     ·分词标准的确定第23-24页
     ·歧义切分处理第24-25页
     ·词性标注方法第25页
     ·未登陆词识别第25-26页
     ·词组识别第26页
   ·TFE-SEG 分词算法第26-32页
     ·构建词典第27-28页
     ·词性标注策略第28-29页
     ·基于专业词典的N-最短路径切分法第29-31页
     ·基于互信息的词组识别第31-32页
     ·分词步骤第32页
   ·实验分析第32-35页
     ·分词的评价准则第32-34页
     ·测试方法第34页
     ·测试结果分析第34-35页
   ·本章小结第35-36页
第三章 文本特征选择方法第36-46页
   ·特征选择模型第36-37页
     ·向量空间模型VSM第36-37页
   ·几种常用的评估函数第37-41页
     ·文档频率DF(Document Frequency)第38页
     ·信息增益IG(Information Gain)第38-39页
     ·互信息MI(Mutual Information)第39页
     ·X2 统计(CHI-square)第39-40页
     ·期望交叉熵ECE(Expect Cross Entropy)第40页
     ·TFIDF第40-41页
   ·ZLP-TFIDF 评估函数第41-43页
     ·确定权值影响因子第41-43页
     ·确定权值评估函数第43页
   ·构建向量空间模型第43页
   ·实验分析第43-44页
   ·本章小节第44-46页
第四章 文本特征提取技术在文本分类中的应用第46-56页
   ·分类系统的实现第46-50页
     ·分类算法的选择第46-47页
     ·分类系统的结构第47-50页
   ·语料库第50页
   ·分类效果评估指标第50-52页
   ·分类测试结果第52-55页
     ·精度测试第53-54页
     ·速度测试第54-55页
   ·本章小节第55-56页
第五章 总结与展望第56-58页
   ·本文总结第56-57页
   ·工作展望第57-58页
致谢第58-59页
参考文献第59-63页
作者在学期间取得的学术成果第63页

论文共63页,点击 下载论文
上一篇:蛋白质组数据库平台开发研究及其相互作用数据的功能分析
下一篇:基于角色的自主访问控制机制的研究与实现