首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于短语特征的Web文档聚类方法研究

中文摘要第1-5页
英文摘要第5-10页
1 绪论第10-19页
   ·问题的提出及研究意义第10-11页
   ·国内外研究现状第11-15页
     ·Web 文本挖掘的内容第11-12页
     ·聚类方法研究进展第12-15页
   ·论文研究目的和内容第15-17页
   ·论文章节安排第17-19页
2 Web 文档聚类相关理论及技术第19-42页
   ·文档表示模型第19-26页
     ·向量空间模型第19-21页
     ·后缀树文档模型第21-26页
   ·特征项权值计算第26-27页
   ·相似度测量第27-29页
     ·明科夫斯基距离第28页
     ·余弦相似度第28页
     ·雅克比相似度第28-29页
   ·聚类算法第29-37页
     ·层次聚类法第29-32页
     ·划分法第32-34页
     ·基于密度的方法第34页
     ·基于网格的方法第34-35页
     ·基于模型的方法第35页
     ·模糊聚类方法第35-36页
     ·增量聚类方法第36-37页
   ·聚类结果质量评测指标第37-38页
     ·F-measure第37-38页
     ·熵第38页
     ·纯度第38页
   ·聚类算法分析第38-41页
     ·聚类算法复杂度分析第38-39页
     ·文档聚类分析过程第39-41页
   ·本章小结第41-42页
3 加权后缀树 Web 文档聚类方法第42-61页
   ·引言第42-43页
   ·后缀树聚类算法第43-49页
     ·文本分析及预处理第43页
     ·后缀树模型第43-47页
     ·基本类簇识别第47页
     ·合并基本类簇第47-49页
   ·加权后缀树聚类算法第49-56页
     ·Web 文档结构分析第49-50页
     ·加权后缀树定义和构造第50-52页
     ·文档预处理第52-53页
     ·基类簇的确定与选择第53-54页
     ·基类簇的合并第54-55页
     ·计算复杂度分析第55-56页
   ·实验与结果分析第56-60页
     ·实验设置第56-57页
     ·评测指标第57页
     ·聚类效果分析第57-59页
     ·时间性能分析第59-60页
   ·本章小结第60-61页
4 基于加权短语相似度的 Web 文档聚类方法第61-76页
   ·引言第61-62页
   ·相关聚类算法第62-63页
   ·基于加权短语的文档相似度第63-70页
     ·WSTVSM 模型第63-68页
     ·基于加权短语的相似度第68页
     ·加权相似度的使用第68-69页
     ·计算复杂度分析第69-70页
     ·去除停用节点第70页
   ·实验结果分析第70-75页
     ·实验设置第70-71页
     ·评测指标第71页
     ·WSTVSM 模型与STVSM 模型的比较第71-72页
     ·时间性能分析第72-74页
     ·短语长度分析第74-75页
   ·本章小结第75-76页
5 优化初始聚类中心选择的 K-means 聚类方法第76-86页
   ·引言第76页
   ·相关聚类算法第76-77页
   ·K-means 算法的基本思想第77-78页
   ·用WSTC 算法优化K-means 算法第78-82页
     ·混合聚类方法STK-means 的基本过程第78-79页
     ·WSTC 算法的基本过程第79-81页
     ·基于加权短语的相似度第81页
     ·确定K-means 初始聚类中心第81-82页
     ·计算复杂度分析第82页
   ·实验结果分析第82-84页
     ·实验设置第82页
     ·评测指标第82页
     ·结果分析第82-84页
   ·本章小结第84-86页
6 总结与展望第86-89页
   ·总结第86-87页
   ·进一步工作展望第87-89页
致谢第89-91页
参考文献第91-105页
附录第105页
 A 作者在攻读博士学位期间发表及录用的论文目录第105页
 B 作者在攻读博士学位期间参加的科研项目及成果第105页

论文共105页,点击 下载论文
上一篇:中文问答系统中的句型理论及其应用研究
下一篇:离群检测及其优化算法研究