摘要 | 第1-5页 |
Abstract | 第5-7页 |
目录 | 第7-10页 |
第一章 绪论 | 第10-23页 |
·研究背景 | 第10-18页 |
·文档数据库 | 第11-14页 |
·文档数据库的概念 | 第11-12页 |
·文档数据库与数据库系统 | 第12-13页 |
·文档数据库的分层结构 | 第13-14页 |
·相关研究工作 | 第14-18页 |
·全文检索 | 第15-16页 |
·结构化文档检索 | 第16页 |
·文本挖据 | 第16-18页 |
·本文工作 | 第18-23页 |
·研究目标 | 第18页 |
·研究内容 | 第18-20页 |
·本文结构 | 第20-23页 |
第二章 互关联后继树全文检索模型--IRST | 第23-43页 |
·引言 | 第23-28页 |
·倒排文档模型 | 第24-25页 |
·签名文档 | 第25-26页 |
·PAT数组 | 第26页 |
·Σ~2邻接矩阵模型 | 第26-28页 |
·IRST模型 | 第28-32页 |
·IRST的创建与查询 | 第32-36页 |
·创建方法 | 第32-34页 |
·原文生成算法 | 第34-35页 |
·查询算法 | 第35-36页 |
·IRST与其他模型的比较 | 第36-40页 |
·实验 | 第40-42页 |
·小结 | 第42-43页 |
第三章 XML文档检索的IR方法 | 第43-58页 |
·引言 | 第43-50页 |
·结构化文档及XML | 第44-46页 |
·XML文档类型 | 第46-47页 |
·“以文档为中心”(document-centric) | 第46页 |
·“以数据为中心”(data-centric) | 第46-47页 |
·XML文档与IR | 第47-50页 |
·DTD和XML schema | 第47-48页 |
·XPath | 第48-49页 |
·XQuery | 第49-50页 |
·CO查询的检索模型 | 第50-53页 |
·Disjoint Nodes | 第51-52页 |
·Indexing Subtrees | 第52页 |
·Content-dependent retrieval | 第52-53页 |
·CO查询研究小结 | 第53页 |
·CAS查询的检索模型 | 第53-57页 |
·Vague XPath | 第54-55页 |
·CAS查询的language models | 第55-56页 |
·Dynamic TF-IDF | 第56-57页 |
·CAS查询研究小结 | 第57页 |
·小结 | 第57-58页 |
第四章 基于结构相似度的XML检索系统 | 第58-77页 |
·引言 | 第58页 |
·文档模型与查询模型 | 第58-61页 |
·XML文档模型 | 第58-60页 |
·XML查询模型 | 第60-61页 |
·检索模型 | 第61-67页 |
·节点距离和邻近度 | 第62-65页 |
·PD模型 | 第65-66页 |
·PP模型 | 第66-67页 |
·原型系统 | 第67-73页 |
·体系结构 | 第67-68页 |
·Xindice | 第68-69页 |
·用户界面 | 第69页 |
·查询处理器 | 第69-70页 |
·索引管理器 | 第70-73页 |
·索引管理器 | 第70-71页 |
·路径倒排索引: | 第71-72页 |
·项倒排索引 | 第72-73页 |
·实验 | 第73-76页 |
·测试文档集 | 第73-75页 |
·测试结果 | 第75-76页 |
·小结 | 第76-77页 |
第五章 基于语义分析的文本过滤 | 第77-95页 |
·引言 | 第77-78页 |
·相关工作 | 第78-80页 |
·倾向性文本过滤 | 第80-82页 |
·问题的提出 | 第80-81页 |
·非法文本的特征 | 第81页 |
·倾向性文本过滤的特征 | 第81-82页 |
·伪装词的文本特征选取方法 | 第82-86页 |
·文本的表示 | 第83页 |
·属性选取算法 | 第83-84页 |
·实验及结果分析 | 第84-86页 |
·基于语义分析的倾向性文本过滤 | 第86-94页 |
·面向倾向性文本过滤的语义分析 | 第86-87页 |
·格语法的精简 | 第87-89页 |
·基本规则的简化 | 第87-88页 |
·语义格表的简化 | 第88页 |
·词汇部分 | 第88-89页 |
·基于语义分析的文本过滤过程 | 第89-92页 |
·过滤过程 | 第89页 |
·过滤模板的表示方法 | 第89-90页 |
·局部语义框架填充的距离函数 | 第90-91页 |
·文本全局语义框架 | 第91-92页 |
·过滤模板与文本全局语义框架的匹配 | 第92页 |
·实验及结果 | 第92-94页 |
·小结 | 第94-95页 |
第六章 基于IRST的文本挖掘 | 第95-115页 |
·引言 | 第95-96页 |
·相关工作 | 第96-99页 |
·频繁模式挖掘 | 第97页 |
·频繁序列模式挖掘 | 第97-99页 |
·文本频繁项集和序列的主要概念 | 第99-100页 |
·基于IRST的频繁项集挖掘 | 第100-107页 |
·直接获取频繁项集的方法 | 第100-102页 |
·直接获取二项集的方法 | 第100页 |
·直接获取三项集的方法 | 第100-102页 |
·间接获取频繁项集的方法 | 第102-104页 |
·算法的改进 | 第104-105页 |
·算法示例 | 第105-107页 |
·基于IRST的文本序列挖掘 | 第107-113页 |
·挖掘算法 | 第107-108页 |
·文本序列挖掘实例 | 第108-110页 |
·实验及分析 | 第110-112页 |
·文本序列挖掘应用与语义模式发现 | 第112-113页 |
·小结 | 第113-115页 |
第7章 总结与展望 | 第115-117页 |
·总结 | 第115-116页 |
·进一步的工作 | 第116-117页 |
参考文献 | 第117-123页 |
参与的科研项目与发表的论文 | 第123-124页 |
1 参与的科研项目 | 第123页 |
2 发表的论文 | 第123-124页 |
致谢 | 第124-125页 |