科技文档的分类与查重
| 中文摘要 | 第1-5页 |
| 英文摘要 | 第5-8页 |
| 第1章 绪论 | 第8-14页 |
| ·本文研究的目的 | 第8-9页 |
| ·本文研究的目的 | 第8-9页 |
| ·本文研究的意义 | 第9页 |
| ·国内外的研究现状 | 第9-13页 |
| ·科技文档分类 | 第9-10页 |
| ·文本相似度计算 | 第10-11页 |
| ·中文分词技术 | 第11-13页 |
| ·本文的创新之处及内容安排 | 第13-14页 |
| ·本文的创新之处 | 第13页 |
| ·本文的内容安排 | 第13-14页 |
| 第2章 对项目申报书的分词 | 第14-21页 |
| ·对申报书分词前的预处理 | 第14页 |
| ·具体分词算法与消歧处理 | 第14-21页 |
| ·分词词典存储格式 | 第14-15页 |
| ·改进的MM 方法 | 第15-18页 |
| ·歧义词处理 | 第18-19页 |
| ·多义字处理 | 第19页 |
| ·未登录词的处理 | 第19-21页 |
| 第3章 中文文本相似度计算 | 第21-33页 |
| ·中文文本相似度计算模型 | 第21-22页 |
| ·相似度 | 第21-22页 |
| ·相似算法 | 第22页 |
| ·中文文本相似度计算的主要方法 | 第22-30页 |
| ·隐性语义标引 | 第22-24页 |
| ·基于向量空间模型的TF-IDF 方法 | 第24-26页 |
| ·基于语义理解的相似度计算方法 | 第26页 |
| ·基于属性论的文本相似度计算方法 | 第26-29页 |
| ·基于汉明距离的文本相似度计算方法 | 第29-30页 |
| ·文本相似度计算方法的选择 | 第30-32页 |
| ·存在问题及发展方向 | 第32-33页 |
| ·存在的问题 | 第32页 |
| ·未来的发展方向 | 第32-33页 |
| 第4章 科技项目的计算机表示与分类、查重 | 第33-52页 |
| ·知识表示的相关方法 | 第33-42页 |
| ·产生式规则表示 | 第33-35页 |
| ·语义网络表示 | 第35-38页 |
| ·框架表示 | 第38-40页 |
| ·面向对象表示 | 第40-42页 |
| ·科技项目的计算机表示 | 第42-43页 |
| ·科技项目的分类规则与特点 | 第43-47页 |
| ·项目分类的必要性 | 第43-45页 |
| ·科技项目分类评价原则 | 第45-46页 |
| ·本文所采用的分类标准 | 第46-47页 |
| ·基于计算机表示的项目分类 | 第47页 |
| ·基于计算机表示的项目聚类方法 | 第47-50页 |
| ·基于误差反传算法的前馈神经网络 | 第47-49页 |
| ·神经网络的训练与申报书聚类的实现 | 第49-50页 |
| ·项目申报书在计算机内的组织方式与知识表示 | 第50-51页 |
| ·项目申报书的查重处理 | 第51-52页 |
| 第5章 系统设计与实施 | 第52-58页 |
| ·系统组成与设计 | 第52-55页 |
| ·分词词典 | 第52-53页 |
| ·文本分词模块 | 第53页 |
| ·汉明码字库集 | 第53-54页 |
| ·领域划分模块 | 第54页 |
| ·申报书聚类模块 | 第54-55页 |
| ·申报书查重模块 | 第55页 |
| ·系统实施 | 第55-56页 |
| ·待解决的问题 | 第56-58页 |
| 结论 | 第58-59页 |
| 参考文献 | 第59-61页 |
| 后记 | 第61页 |