首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本挖掘关键技术研究

摘要第1-4页
ABSTRACT第4-7页
1 引言第7-11页
   ·研究背景第7页
   ·历史现状第7-9页
   ·研究意义第9页
   ·本文主要工作第9-10页
   ·全文章节安排第10-11页
2 文本挖掘概述第11-15页
   ·文本挖掘定义第11页
   ·文本挖掘流程第11-13页
   ·文本挖掘任务第13-14页
     ·文本分类第13页
     ·文本聚类第13页
     ·文本标引第13-14页
     ·实体关系抽取第14页
     ·领域本体构建第14页
   ·文本挖掘关键技术第14-15页
3 文本表示第15-30页
   ·文本表示定义第15-16页
   ·文本表示模型第16页
   ·向量空间模型第16-17页
   ·向量空间模型改进工作第17-19页
   ·词共现第19-21页
   ·结合词共现因子的语义向量空间模型第21-23页
     ·词共现因子计算第21-22页
     ·词共现因子加权第22页
     ·VSM和WCFVSM构建流程第22-23页
   ·实验及结果分析第23-29页
     ·实验语料第23-24页
     ·实验平台第24页
     ·统计关键词信息第24-25页
     ·统计二阶共现词信息第25-26页
     ·构建VSM和WCFVSM第26页
     ·分类实验结果及分析第26-29页
   ·本章总结第29-30页
4 术语识别第30-43页
   ·术语相关定义第30页
   ·术语相关特性第30-31页
   ·领域术语识别研究现状第31页
   ·常用术语识别方法第31-33页
     ·基于规则的方法第31-32页
     ·基于统计的方法第32页
     ·统计和规则相结合的方法第32页
     ·基于机器学习的方法第32-33页
   ·条件随机场算法理论和工具第33-36页
     ·条件随机场算法理论第33-35页
     ·条件随机场算法工具第35-36页
   ·基于条件随机场算法的术语识别工作第36页
   ·基于条件随机场算法的单模型术语识别方法第36-37页
   ·基于条件随机场算法的多模型术语识别方法第37-38页
     ·多模型术语识别思想第37页
     ·多模型术语识别流程第37-38页
   ·实验及结果分析第38-42页
     ·实验语料第38页
     ·实验平台第38-39页
     ·获取初始词典第39页
     ·语料预处理第39页
     ·模型训练第39页
     ·新术语识别第39-40页
     ·新术语测试第40-41页
     ·错误分析第41-42页
   ·本章总结第42-43页
5 总结与展望第43-44页
   ·总结第43页
   ·展望第43-44页
参考文献第44-47页
个人简介第47-48页
导师简介第48-49页
获得成果目录清单第49-50页
致谢第50-51页

论文共51页,点击 下载论文
上一篇:基于进化计算的源代码同源性分析
下一篇:基于图像的花卉植物三维重建技术研究