互联网文本聚类与检索技术研究
摘要 | 第1-6页 |
Abstract | 第6-15页 |
第1章 绪论 | 第15-36页 |
·课题背景及意义 | 第15-17页 |
·国内外研究现状及分析 | 第17-32页 |
·文本聚类的问题描述 | 第18-20页 |
·文本相似性衡量 | 第20-24页 |
·文本聚类算法综述 | 第24-31页 |
·自然语言处理技术在文本挖掘中的应用 | 第31-32页 |
·本文的研究内容 | 第32-34页 |
·本文的内容安排 | 第34-36页 |
第2章 文本聚类的语义特征降维研究 | 第36-57页 |
·引言 | 第36-37页 |
·文本聚类特征降维概述 | 第37-43页 |
·向量空间模型 | 第37-40页 |
·特征降维基本概念 | 第40-41页 |
·典型的文本聚类特征降维技术 | 第41-43页 |
·基于词法分析技术的特征选择算法 | 第43-47页 |
·文档预处理和词法分析 | 第44-45页 |
·基于词法分析的特征选择 | 第45-47页 |
·基于语义词典的特征约简方法 | 第47-50页 |
·语义信息词典 | 第48-49页 |
·基于语义词典的特征降维 | 第49-50页 |
·实验结果与分析 | 第50-55页 |
·文本聚类算法 | 第51-52页 |
·数据集描述 | 第52页 |
·实验基准与评测方法 | 第52-55页 |
·本章小结 | 第55-57页 |
第3章 基于容错粗糙集的搜索结果聚类研究 | 第57-86页 |
·引言 | 第57-58页 |
·搜索结果聚类简介 | 第58-62页 |
·容错粗糙集技术 | 第62-64页 |
·基于容错粗糙集技术的搜索结果聚类算法 | 第64-73页 |
·上下文特征选择 | 第65-66页 |
·基于容错粗糙集的文本语义扩展 | 第66-68页 |
·词语相关度计算 | 第68-71页 |
·原始聚类合并 | 第71-72页 |
·聚类标签生成 | 第72-73页 |
·实验与结果分析 | 第73-84页 |
·数据集描述 | 第73-74页 |
·数据预处理 | 第74-75页 |
·初始基聚类选择 | 第75-76页 |
·相关参数对词语相关度计算的影响 | 第76-77页 |
·时间复杂性测试 | 第77页 |
·聚类结果的覆盖率和重叠率 | 第77-80页 |
·聚类结果的质量 | 第80-84页 |
·本章小结 | 第84-86页 |
第4章 基于频繁词集挖掘的文本聚类研究 | 第86-103页 |
·引言 | 第86-87页 |
·频繁项集挖掘简介 | 第87-90页 |
·频繁项集的基本概念 | 第88-89页 |
·基于频繁项集的聚类算法 | 第89-90页 |
·上下文约束闭频繁词集及其挖掘算法 | 第90-96页 |
·上下文约束闭频繁词集相关定义 | 第90-93页 |
·上下文约束闭频繁词集挖掘算法 | 第93-96页 |
·相似度衡量算法 | 第96-97页 |
·实验与结果分析 | 第97-101页 |
·数据集描述 | 第97页 |
·基于词法分析技术的特征选择 | 第97-98页 |
·性能评价 | 第98-99页 |
·约束类型对聚类结果的影响 | 第99-100页 |
·已有算法对比 | 第100-101页 |
·本章小结 | 第101-103页 |
第5章 基于自动文摘的Web检索 | 第103-124页 |
·引言 | 第103页 |
·网页预处理技术 | 第103-107页 |
·网页处理相关技术 | 第104-105页 |
·基于内容单元的网页解析 | 第105-106页 |
·网页内容提取 | 第106-107页 |
·检索结果排序算法 | 第107-113页 |
·网页链接排序算法 | 第107-109页 |
·信息检索模型 | 第109-113页 |
·基于自动文摘的信息检索系统 | 第113-119页 |
·自动文摘技术简介 | 第113-115页 |
·自动文摘技术在信息检索中的应用 | 第115-116页 |
·自动文摘生成算法 | 第116-118页 |
·系统总体架构 | 第118-119页 |
·实验结果与分析 | 第119-122页 |
·基于摘要的搜索结果排序评测 | 第119页 |
·数据集及其相关的预处理过程 | 第119-120页 |
·结果与分析 | 第120-122页 |
·本章小结 | 第122-124页 |
结论 | 第124-127页 |
参考文献 | 第127-144页 |
攻读博士学位期间发表的学术论文 | 第144-146页 |
致谢 | 第146-148页 |
个人简历 | 第148页 |