| 摘要 | 第1-5页 |
| Abstract | 第5-7页 |
| 目录 | 第7-10页 |
| 第一章 绪论 | 第10-23页 |
| ·研究背景 | 第10-18页 |
| ·文档数据库 | 第11-14页 |
| ·文档数据库的概念 | 第11-12页 |
| ·文档数据库与数据库系统 | 第12-13页 |
| ·文档数据库的分层结构 | 第13-14页 |
| ·相关研究工作 | 第14-18页 |
| ·全文检索 | 第15-16页 |
| ·结构化文档检索 | 第16页 |
| ·文本挖据 | 第16-18页 |
| ·本文工作 | 第18-23页 |
| ·研究目标 | 第18页 |
| ·研究内容 | 第18-20页 |
| ·本文结构 | 第20-23页 |
| 第二章 互关联后继树全文检索模型--IRST | 第23-43页 |
| ·引言 | 第23-28页 |
| ·倒排文档模型 | 第24-25页 |
| ·签名文档 | 第25-26页 |
| ·PAT数组 | 第26页 |
| ·Σ~2邻接矩阵模型 | 第26-28页 |
| ·IRST模型 | 第28-32页 |
| ·IRST的创建与查询 | 第32-36页 |
| ·创建方法 | 第32-34页 |
| ·原文生成算法 | 第34-35页 |
| ·查询算法 | 第35-36页 |
| ·IRST与其他模型的比较 | 第36-40页 |
| ·实验 | 第40-42页 |
| ·小结 | 第42-43页 |
| 第三章 XML文档检索的IR方法 | 第43-58页 |
| ·引言 | 第43-50页 |
| ·结构化文档及XML | 第44-46页 |
| ·XML文档类型 | 第46-47页 |
| ·“以文档为中心”(document-centric) | 第46页 |
| ·“以数据为中心”(data-centric) | 第46-47页 |
| ·XML文档与IR | 第47-50页 |
| ·DTD和XML schema | 第47-48页 |
| ·XPath | 第48-49页 |
| ·XQuery | 第49-50页 |
| ·CO查询的检索模型 | 第50-53页 |
| ·Disjoint Nodes | 第51-52页 |
| ·Indexing Subtrees | 第52页 |
| ·Content-dependent retrieval | 第52-53页 |
| ·CO查询研究小结 | 第53页 |
| ·CAS查询的检索模型 | 第53-57页 |
| ·Vague XPath | 第54-55页 |
| ·CAS查询的language models | 第55-56页 |
| ·Dynamic TF-IDF | 第56-57页 |
| ·CAS查询研究小结 | 第57页 |
| ·小结 | 第57-58页 |
| 第四章 基于结构相似度的XML检索系统 | 第58-77页 |
| ·引言 | 第58页 |
| ·文档模型与查询模型 | 第58-61页 |
| ·XML文档模型 | 第58-60页 |
| ·XML查询模型 | 第60-61页 |
| ·检索模型 | 第61-67页 |
| ·节点距离和邻近度 | 第62-65页 |
| ·PD模型 | 第65-66页 |
| ·PP模型 | 第66-67页 |
| ·原型系统 | 第67-73页 |
| ·体系结构 | 第67-68页 |
| ·Xindice | 第68-69页 |
| ·用户界面 | 第69页 |
| ·查询处理器 | 第69-70页 |
| ·索引管理器 | 第70-73页 |
| ·索引管理器 | 第70-71页 |
| ·路径倒排索引: | 第71-72页 |
| ·项倒排索引 | 第72-73页 |
| ·实验 | 第73-76页 |
| ·测试文档集 | 第73-75页 |
| ·测试结果 | 第75-76页 |
| ·小结 | 第76-77页 |
| 第五章 基于语义分析的文本过滤 | 第77-95页 |
| ·引言 | 第77-78页 |
| ·相关工作 | 第78-80页 |
| ·倾向性文本过滤 | 第80-82页 |
| ·问题的提出 | 第80-81页 |
| ·非法文本的特征 | 第81页 |
| ·倾向性文本过滤的特征 | 第81-82页 |
| ·伪装词的文本特征选取方法 | 第82-86页 |
| ·文本的表示 | 第83页 |
| ·属性选取算法 | 第83-84页 |
| ·实验及结果分析 | 第84-86页 |
| ·基于语义分析的倾向性文本过滤 | 第86-94页 |
| ·面向倾向性文本过滤的语义分析 | 第86-87页 |
| ·格语法的精简 | 第87-89页 |
| ·基本规则的简化 | 第87-88页 |
| ·语义格表的简化 | 第88页 |
| ·词汇部分 | 第88-89页 |
| ·基于语义分析的文本过滤过程 | 第89-92页 |
| ·过滤过程 | 第89页 |
| ·过滤模板的表示方法 | 第89-90页 |
| ·局部语义框架填充的距离函数 | 第90-91页 |
| ·文本全局语义框架 | 第91-92页 |
| ·过滤模板与文本全局语义框架的匹配 | 第92页 |
| ·实验及结果 | 第92-94页 |
| ·小结 | 第94-95页 |
| 第六章 基于IRST的文本挖掘 | 第95-115页 |
| ·引言 | 第95-96页 |
| ·相关工作 | 第96-99页 |
| ·频繁模式挖掘 | 第97页 |
| ·频繁序列模式挖掘 | 第97-99页 |
| ·文本频繁项集和序列的主要概念 | 第99-100页 |
| ·基于IRST的频繁项集挖掘 | 第100-107页 |
| ·直接获取频繁项集的方法 | 第100-102页 |
| ·直接获取二项集的方法 | 第100页 |
| ·直接获取三项集的方法 | 第100-102页 |
| ·间接获取频繁项集的方法 | 第102-104页 |
| ·算法的改进 | 第104-105页 |
| ·算法示例 | 第105-107页 |
| ·基于IRST的文本序列挖掘 | 第107-113页 |
| ·挖掘算法 | 第107-108页 |
| ·文本序列挖掘实例 | 第108-110页 |
| ·实验及分析 | 第110-112页 |
| ·文本序列挖掘应用与语义模式发现 | 第112-113页 |
| ·小结 | 第113-115页 |
| 第7章 总结与展望 | 第115-117页 |
| ·总结 | 第115-116页 |
| ·进一步的工作 | 第116-117页 |
| 参考文献 | 第117-123页 |
| 参与的科研项目与发表的论文 | 第123-124页 |
| 1 参与的科研项目 | 第123页 |
| 2 发表的论文 | 第123-124页 |
| 致谢 | 第124-125页 |