首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

一种文本聚类原型系统的设计与实现

摘要第1-5页
Abstract第5-8页
1 引言第8-17页
   ·问题的提出第8-9页
   ·聚类的研究现状第9-12页
   ·文本聚类的研究现状第12-16页
   ·本文研究内容第16-17页
2 文本聚类系统的分析第17-29页
   ·系统概述第17页
   ·系统的功能分析第17-18页
     ·系统目标第17页
     ·系统内容第17-18页
     ·系统应达到的技术指标第18页
   ·系统的流程分析第18-19页
   ·文本建模方法的分析第19-22页
     ·文本的表示第19页
     ·分词处理与词频统计第19-21页
     ·文本特征的筛选第21-22页
     ·特征项的权重计算第22页
   ·聚类算法的分析第22-28页
     ·算法的选择第23页
     ·k平均值算法第23-24页
     ·k中心点算法第24-25页
     ·数据表示第25-27页
     ·相似度的度量第27-28页
   ·语料库的选择第28-29页
3 文本聚类系统的设计第29-36页
   ·系统的功能模块设计第29-32页
     ·聚类分析模块第29-30页
     ·新文本分类模块第30页
     ·无特征词管理模块第30-31页
     ·同义词管理模块第31-32页
   ·人机交互界面设计第32-33页
   ·系统的结构设计第33-36页
     ·系统的总体结构设计第33-34页
     ·系统的网络结构第34-35页
     ·系统的物理架构第35-36页
4 文本聚类系统的实现第36-44页
   ·数据库的设计与实现第36-38页
     ·文本信息数据库的设计第36-37页
     ·词表数据库的设计第37页
     ·聚类模型数据库的设计第37-38页
     ·JDBC连接实现第38页
   ·后台数据处理子系统的实现第38-42页
     ·向量空间模型(VSM)的建立第38-40页
     ·聚类算法的实现第40-41页
     ·同义词和无特征词管理的实现第41-42页
     ·建立类模型用于分类第42页
   ·前台用户操作子系统的实现第42-44页
5 文本聚类系统的应用实例第44-49页
   ·聚类分析第44-48页
   ·新文本分类第48-49页
结论第49-50页
参考文献第50-52页
附录A k平均值和k中心点核心算法第52-57页
攻读硕士学位期间发表学术论文情况第57-58页
致谢第58-59页
大连理工大学学位论文版权使用授权书第59页

论文共59页,点击 下载论文
上一篇:术前腰腧穴注射氢溴酸高乌甲素对痔术后镇痛量—效关系的临床研究
下一篇:战略研究支持系统中的结构化检索方法研究