机器学习算法在文本分析中的研究

摘要	第1-4页
ABSTRACT	第4-9页
第一章绪论	第9-12页
·项目背景及研究意义	第9-11页
·项目背景	第9-10页
·研究意义	第10页
·研究的主要问题及国内外现状	第10-11页
·本文的主要内容及章节安排	第11-12页
第二章算法及相关概念综述	第12-25页
·聚类算法研究	第12-17页
·聚类算法	第12-14页
·聚类过程	第14-16页
·评估标准	第16-17页
·热点信息发现研究	第17-18页
·热点信息发现概念及特征	第17页
·热点对技术的挑战	第17-18页
·针对算法运行过程的事务性文件系统研究	第18-24页
·事务ACID 特性	第18-19页
·计算依赖与事务依赖	第19-20页
·原子操作模型及其依赖触发	第20-21页
·持久性保存点及事务恢复	第21-22页
·并发控制及其注意事项	第22-23页
·系统可靠性及其相关	第23-24页
·一致性哈希(Consistent Hash)	第24页
·本章小结	第24-25页
第三章优化初始化中心选取的聚类算法	第25-42页
·聚类算法选取及改进	第25-31页
·适用环境及聚类目标	第25页
·算法选取	第25-26页
·算法优化	第26-31页
·聚类算法运行环境	第31-32页
·系统开发及运行环境	第31-32页
·系统依赖项	第32页
·聚类实现预处理	第32-35页
·语料格式预处理	第32-33页
·分词模块及系统构建	第33-35页
·聚类过程及聚类结果处理	第35-41页
·词典空间建立	第35-38页
·随机化语料存取	第38-39页
·聚类过程的系统实现	第39-40页
·系统聚类结果输出	第40-41页
·本章小结	第41-42页
第四章基于串频统计的热点信息发现算法	第42-49页
·热点信息发现概述	第42-43页
·热点信息发现的任务及意义	第42页
·热点信息发现的运行环境	第42-43页
·热点信息发现的核心算法	第43页
·热点信息发现的基本思想	第43页
·热点信息发现的解决方案关键点	第43页
·热点信息发现的核心算法及实现过程	第43-48页
·准备工作及预处理	第43-45页
·热点算法基础矩阵	第45-46页
·基于词频的热点算法设计	第46-48页
·本章小结	第48-49页
第五章针对聚类及热点算法运行过程的事务性文件处理系统	第49-59页
·事务性文件系统概述	第49-51页
·TPFS 存在的意义	第49-50页
·TPFS 内容寻址	第50-51页
·TPFS 的主要构成	第51页
·事务性调度模块	第51-53页
·原子操作和扁平事务	第51-52页
·事务性调度模块的策略及实现	第52-53页
·逻辑封装模块及其实现	第53-57页
·逻辑封装模块的作用	第53页
·HASH 文件逻辑结构	第53-56页
·HASH 文件逻辑操作	第56-57页
·容错模块的作用及实现	第57-58页
·容错模块的作用	第57-58页
·容错模块的实现	第58页
·本章小结	第58-59页
第六章结束语	第59-60页
参考文献	第60-63页
发表论文和参加科研情况说明	第63-64页
致谢	第64页