首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

中文Web文本挖掘的若干关键技术研究及其实现

摘要第1-3页
ABSTRACT第3-6页
第一章 绪论第6-10页
   ·课题的来源和研究背景第6-7页
   ·课题研究的意义第7-8页
   ·课题的研究现状第8-9页
   ·本文的主要工作第9页
   ·全文的组织第9-10页
第二章 Web 文本挖掘概述第10-16页
   ·Web 文本挖掘的定义第10-11页
   ·Web 的数据模型和结构特点第11-12页
   ·Web 文本挖掘的任务第12-13页
   ·Web 文本挖掘的主要应用领域第13页
   ·Web 文本挖掘的一般过程第13-14页
   ·中文Web 文本挖掘的主要步骤第14-15页
   ·本章小结第15-16页
第三章 中文文本的分词处理第16-30页
   ·中文语句书写的特点第16页
   ·常见的中文分词方法第16-17页
   ·切分歧义定义第17-18页
   ·中文词语粗切分第18-22页
     ·词典结构设计第18-20页
     ·中文粗切分算法第20-22页
   ·分词歧义处理第22-27页
     ·交集型歧义处理第22页
     ·交集型歧义消歧实验第22-23页
     ·基于事例学习的组合型歧义处理第23-27页
       ·事例的表示和事例库构建第23-24页
       ·事例相似度计算第24-26页
       ·事例检索过程第26-27页
     ·组合型歧义消歧实验第27页
   ·未登录词识别第27-29页
     ·候选字段的选择第27页
     ·识别策略第27-28页
     ·未登录词识别实验第28-29页
   ·本章小结第29-30页
第四章 文本特征表示与特征选择第30-37页
   ·文本特征表示的预处理第30-31页
     ·停用词过滤第30页
     ·低频词过滤第30-31页
   ·文本的特征表示第31-34页
     ·文本特征的定义第31页
     ·向量空间模型第31-33页
     ·特征项的权值计算第33-34页
   ·特征选择第34-36页
     ·特征选择的定义第34页
     ·特征选择的目的第34页
     ·常见特征选择方法第34-36页
     ·特征选择的实现第36页
   ·本章小结第36-37页
第五章 基于概念的中文文本聚类第37-48页
   ·文本聚类的研究进展和解决思路第37-39页
     ·研究进展第37-38页
     ·研究的难点第38页
     ·本文的解决思路第38-39页
   ·基于概念的中文文本聚类算法第39-47页
     ·算法的基本思想第39页
     ·知网的理论背景和结构第39-41页
     ·算法的设计第41-47页
       ·算法的主要步骤第41页
       ·概念层次结构的建立第41-43页
       ·概念映射第43-44页
       ·概念消歧第44-45页
       ·一种改进的K 中心点聚类分析第45-47页
       ·文档类簇的概念描述第47页
   ·本章小结第47-48页
第六章 系统的实现与实验结果分析第48-56页
   ·系统的设计与实现第48-50页
     ·系统的开发平台第48页
     ·系统的整体结构第48-49页
     ·系统子模块的实现第49-50页
   ·实验和结果分析第50-56页
     ·中文文本分词实验和分析第51页
     ·文本聚类实验和分析第51-56页
第七章 总结和展望第56-58页
   ·全文总结第56-57页
   ·下一步工作第57-58页
参考文献第58-61页
致谢第61-62页
个人简历、在学期间研究工作及发表论文第62页

论文共62页,点击 下载论文
上一篇:生态脆弱区植被的生态服务功能价值化研究
下一篇:新时期我国高师体育教育专业田径普修课程改革的文化审视