首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间的文本自动分类系统的研究和实现

第一章 绪论第1-11页
 1.1 背景第7页
 1.2 中文搜索引擎的现状和不足第7-9页
  1.2.1 中文搜索引擎的现状第7-8页
  1.2.2 中文搜索引擎的不足第8-9页
 1.3 新一代智能搜索引擎的架构设计第9-10页
  1.3.1 在人机界面中的应用第10页
  1.3.2 在分析模块中的应用第10页
 1.4 课题来源第10页
 1.5 本文的研究内容第10-11页
第二章 自然语言理解概述第11-17页
 2.1 自然语言理解的基本概念第11-12页
  2.1.1 什么是自然语言第11页
  2.1.2 什么是自然语言理解第11页
  2.1.3 关于理解第11-12页
 2.2 自然语言理解的困难度第12-13页
 2.3 自然语言理解模型第13-15页
 2.4 语言及汉语的特点第15-17页
  2.4.1 自然语言的基本特征第15-16页
  2.4.2 汉语的特点第16-17页
第三章 文本分类与文本检索的关系第17-21页
 3.1 信息检索系统的组成第17页
 3.2 布尔检索模型第17-18页
 3.3 向量空间模型第18-19页
 3.4 概率模型第19-21页
第四章 文本分类与信息提取的关系第21-28页
 4.1 信息提取系统的概念第21页
 4.2 信息提取系统的任务第21页
 4.3 信息提取系统的基本组成部件第21-28页
  4.3.1 命名实体的识别第22-23页
  4.3.2 信息提取系统中的句法分析第23-27页
  4.3.3 共指消解第27-28页
第五章 文本分类第28-33页
 5.1 文本自动分类的基本概念第28-29页
 5.2 文本自动分类的分类方法第29-31页
  5.2.1 贝叶斯分类法第30页
  5.2.2 决策树分类法第30-31页
  5.2.3 最近K邻居方法第31页
 5.3 自动分类在搜索引擎中应用的实例第31-33页
第六章 实验系统的设计方案第33-38页
 6.1 系统任务第33页
 6.2 系统的总体框架结构第33-34页
 6.3 分类前的文本处理第34页
 6.4 特征项的抽取第34-36页
 6.5 分类算法第36-37页
  6.5.1 简单向量距离分类法第36页
  6.5.2 阈值的确定第36-37页
 6.6 评估方法第37-38页
第七章 实验系统的实现第38-51页
 7.1 文本自动分类系统的概要设计第38-39页
 7.2 系统的详细设计第39-44页
  7.2.1 包路径设计第39-40页
  7.2.2 类(主要部分)的设计第40-41页
  7.2.3 存储设计第41-42页
  7.2.4 数据库设计第42-43页
  7.2.5 视图设计第43-44页
 7.3 系统实现第44-49页
  7.3.1 源文件说明第44-45页
  7.3.2 管道的实现第45-46页
  7.3.3 线程池的实现第46-47页
  7.3.4 数据库代理实现第47-48页
  7.3.5 分类算法实现第48-49页
  7.3.6 多线程同步第49页
 7.4 实验结果第49-50页
 7.5 实验结果评估第50-51页
总结第51-52页
参考文献第52-54页
致谢第54-55页
攻读硕士生期间所发表的论文第55页

论文共55页,点击 下载论文
上一篇:二十世纪中国小说中的弃妇形象简论
下一篇:白银市优质春小麦新品种引进筛选及丰产栽培技术研究