摘要 | 第1-4页 |
ABSTRACT | 第4-7页 |
1 绪论 | 第7-10页 |
·课题背景及问题陈述 | 第7-8页 |
·国内外研究现状 | 第8-9页 |
·本文研究工作简介 | 第9页 |
·本文组织结构 | 第9-10页 |
2 分布式文本检索及元搜索概要 | 第10-17页 |
·分布式文本检索及方法 | 第10-11页 |
·元搜索及元搜索引擎 | 第11-15页 |
·数据库的选择(Database Selection) | 第12-14页 |
·转换并发送搜索命令(Query Dispatcher) | 第14页 |
·搜索结果合并(Result Merge) | 第14-15页 |
·文本数据库及其归类问题 | 第15-16页 |
·小结 | 第16-17页 |
3 文本数据库表征和排序的研究 | 第17-27页 |
·语义相似度及文本归类 | 第17页 |
·文本数据库的表征 | 第17-21页 |
·基于查询的样本表征法(Query-based Sampling) | 第18-19页 |
·多层的数据库表征法(Hierarchical Database Sampling) | 第19-21页 |
·文本数据库的排序 | 第21-26页 |
·修正最大归一权重法(Adjusted Maximum Normalized Weight) | 第22-23页 |
·综合的数据库表征(Integrated Representative of database) | 第23-24页 |
·词组合算法(Term Combination) | 第24-26页 |
·小结 | 第26-27页 |
4 文本数据库表征和排序的改进 | 第27-35页 |
·无用词表(STOPWORD LIST)的调整 | 第27-29页 |
·有反馈的修正最大归一权重法(AMNW WITH FEEDBACK) | 第29-31页 |
·相关词和近义词 | 第31-33页 |
·词的组合算法改进 | 第33页 |
·小结 | 第33-35页 |
5 实验及结果分析 | 第35-44页 |
·分项测试 | 第35-41页 |
·调整后的无用词表测试 | 第35-37页 |
·加入反馈后的修正最大归一权重测试 | 第37-39页 |
·相关词和近义词测试 | 第39-40页 |
·改进后的词组合算法测试 | 第40-41页 |
·综合测试 | 第41-42页 |
·文本长度和内容的影响 | 第42-43页 |
·小结 | 第43-44页 |
6 结语 | 第44-46页 |
·本文工作总结 | 第44页 |
·后续研究计划 | 第44-46页 |
致谢 | 第46-47页 |
参考文献 | 第47-49页 |
附录 | 第49页 |