首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

汉语文本数据挖掘--基于市长公开电话数据库的统计分析

提要第1-8页
第一章 汉语文本数据特点分析第8-26页
   ·研究的背景和意义第8-9页
   ·文本分类概述第9-18页
   ·市长公开电话数据集简介第18-20页
   ·市长公开电话词库的构建第20-22页
   ·市长公开电话词频曲线拟合第22-26页
第二章 热点问题数据挖掘第26-54页
   ·热点问题背景及意义第26-27页
   ·热点词的抽取方法第27-32页
     ·热点词的定义第27-28页
     ·停用词的抽取方法第28-30页
     ·热点词的特征选择第30-32页
   ·热点词的抽取结果及其分析第32-40页
   ·热点词的聚类分析第40-46页
     ·热点词的变量聚类过程第41-42页
     ·热点词的变量聚类结果分析第42-46页
   ·确定聚类数目的一种方法第46-54页
第三章 汉语文本分类器第54-94页
   ·朴素贝叶斯分类器第54-60页
   ·改进的朴素贝叶斯分类器第60-65页
     ·分类类别与时间的独立性的检验第60-61页
     ·基于时序数据的朴素贝叶斯分类器模型第61-65页
   ·基于加权的朴素贝叶斯分类器第65-69页
     ·权重计算方法第66-68页
     ·在市长公开电话上的应用第68-69页
   ·支持向量机分类器第69-81页
     ·支持向量机分类算法第69-74页
     ·在市长公开电话上的应用第74-81页
   ·支持向量机并行处理策略第81-84页
   ·基于规则的得分法文本分类器第84-94页
     ·基于二项检验的特征词提取第84-86页
     ·基于词频的特征词词组提取第86-94页
第四章 基于任务驱动的并行分类算法第94-123页
   ·任务驱动的并行算法第94-96页
   ·决策树分类器模型第96-103页
     ·决策树分类算法第96-98页
     ·任务驱动的决策树并行学习算法第98-101页
     ·在市长公开电话上的应用第101-103页
   ·基于并行计算的贝叶斯多网学习第103-116页
     ·贝叶斯多网的简介第104-109页
     ·贝叶斯网的层次结构第109-111页
     ·卡方序K2并行算法构建贝叶斯多网第111-114页
     ·在市长公开电话中的应用第114-116页
   ·基于因果关系的生物神经网络初探第116-123页
结论第123-125页
参考文献第125-134页
附录第134-151页
 附录1 并行C和C++程序模块的简易调试环境第134-136页
 附录2 计算素数的并行程序(标准模板)第136-137页
 附录3 决策树构建的并行C++程序第137-143页
 附录4 贝叶斯网构建的并行C程序模块第143-148页
 附录5 基于遗传算法定序的课程贝叶斯网构建第148-151页
攻博期间发表和录用的学术论文及其他成果第151-152页
中文摘要第152-160页
ABSTRACT第160-170页
致谢第170页

论文共170页,点击 下载论文
上一篇:面向汽车驾驶模拟器的网格计算关键技术研究
下一篇:群智能算法的改进及其在相关领域中的应用