首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本体裁的自动分类机制

摘要第1-5页
Abstract第5-9页
1 绪论第9-12页
 1.1 研究背景第9页
 1.2 应用领域第9-10页
 1.3 研究对象第10-11页
 1.4 实现程度第11-12页
2 中文体裁与文本分类第12-22页
 2.1 体裁考源第12-19页
  2.1.1 体裁的概念考证第12-16页
  2.1.2 相关内容的讨论第16-17页
  2.1.3 体裁与文章写作第17页
  2.1.4 体裁分类与统计第17-18页
  2.1.5 体裁分类与语种第18-19页
 2.2 文本分类第19-21页
  2.2.1 语料库问题第19-20页
  2.2.2 分类角度问题第20-21页
 2.3 体裁分类与文本分类第21-22页
  2.3.1 两者理论关系中的隶属性第21页
  2.3.2 两者研究手段的异同之处第21-22页
3 文本按体裁自动分类研究第22-27页
 3.1 研究概况第22-25页
  3.1.1 目前体裁自动分类研究的技术进展第22页
  3.1.2 国外体裁自动分类有关的研究工作第22-25页
  3.1.3 国内体裁自动分类有关的研究工作第25页
 3.2 发展动态第25-27页
  3.2.1 体裁自动分类研究发展的趋势第25-26页
  3.2.2 制约体裁自动分类研究的难点问题第26-27页
4 特征项的提取第27-49页
 4.1 本文体裁特性的分析第27-29页
  4.1.1 语体对语音的制约第27页
  4.1.2 语体对词语的制约第27-28页
  4.1.3 语体对语法的制约第28-29页
  4.1.4 语体对辞格的制约第29页
 4.2 度量特性的一般手段第29-31页
 4.3 体裁自动分类特征项的选定第31-38页
  4.3.1 特征项常见类型第31-32页
  4.3.2 特征项选取过程第32-33页
  4.3.3 特征项效果观察第33-34页
  4.3.4 特征项评价方法第34-36页
  4.3.5 本文特征项选取第36-38页
 4.4 体裁自动分类特征项的提取第38-49页
  4.4.1 词汇包方法基本原理第39-42页
  4.4.2 词汇线索的提取第42-44页
  4.4.3 符号线索的提取第44-47页
  4.4.4 位置线索的提取第47-48页
  4.4.5 浅层分析级线索的提取第48-49页
5 中文文本体裁自动分类机制第49-61页
 5.1 任务描述第49-50页
  5.1.1 文本分类形式化描述第49页
  5.1.2 系统任务的简要描述第49-50页
 5.2 系统概述第50-53页
  5.2.1 系统整体的设计思想第50-51页
  5.2.2 系统组成与工作流程第51-52页
  5.2.3 前期预处理工作内容第52页
  5.2.4 输入输出内容格式第52-53页
  5.2.5 系统实现所采用的语言第53页
 5.3 技术实现第53-55页
  5.3.1 体裁自动分类体系的确立第53-54页
  5.3.2 体裁自动分类算法的选取第54-55页
 5.4 结果分析第55-61页
  5.4.1 本文系统分类评估方法第55-56页
  5.4.2 本文系统分类算法的评价第56-57页
  5.4.3 本文系统影响结果的因素第57-59页
  5.4.4 本文系统的优缺点分析第59-61页
结论第61-62页
参考文献第62-65页
附录A:特征项的实例第65-69页
攻读硕士学位期间发表学术论文情况第69-70页
致谢第70-71页
大连理工大学学位论文版权使用授权书第71页

论文共71页,点击 下载论文
上一篇:大学校园室外空间环境规划研究--扩招并校后的大学校园
下一篇:TRIPs与我国知识产权立法研究