科技文档的分类与查重
中文摘要 | 第1-5页 |
英文摘要 | 第5-8页 |
第1章 绪论 | 第8-14页 |
·本文研究的目的 | 第8-9页 |
·本文研究的目的 | 第8-9页 |
·本文研究的意义 | 第9页 |
·国内外的研究现状 | 第9-13页 |
·科技文档分类 | 第9-10页 |
·文本相似度计算 | 第10-11页 |
·中文分词技术 | 第11-13页 |
·本文的创新之处及内容安排 | 第13-14页 |
·本文的创新之处 | 第13页 |
·本文的内容安排 | 第13-14页 |
第2章 对项目申报书的分词 | 第14-21页 |
·对申报书分词前的预处理 | 第14页 |
·具体分词算法与消歧处理 | 第14-21页 |
·分词词典存储格式 | 第14-15页 |
·改进的MM 方法 | 第15-18页 |
·歧义词处理 | 第18-19页 |
·多义字处理 | 第19页 |
·未登录词的处理 | 第19-21页 |
第3章 中文文本相似度计算 | 第21-33页 |
·中文文本相似度计算模型 | 第21-22页 |
·相似度 | 第21-22页 |
·相似算法 | 第22页 |
·中文文本相似度计算的主要方法 | 第22-30页 |
·隐性语义标引 | 第22-24页 |
·基于向量空间模型的TF-IDF 方法 | 第24-26页 |
·基于语义理解的相似度计算方法 | 第26页 |
·基于属性论的文本相似度计算方法 | 第26-29页 |
·基于汉明距离的文本相似度计算方法 | 第29-30页 |
·文本相似度计算方法的选择 | 第30-32页 |
·存在问题及发展方向 | 第32-33页 |
·存在的问题 | 第32页 |
·未来的发展方向 | 第32-33页 |
第4章 科技项目的计算机表示与分类、查重 | 第33-52页 |
·知识表示的相关方法 | 第33-42页 |
·产生式规则表示 | 第33-35页 |
·语义网络表示 | 第35-38页 |
·框架表示 | 第38-40页 |
·面向对象表示 | 第40-42页 |
·科技项目的计算机表示 | 第42-43页 |
·科技项目的分类规则与特点 | 第43-47页 |
·项目分类的必要性 | 第43-45页 |
·科技项目分类评价原则 | 第45-46页 |
·本文所采用的分类标准 | 第46-47页 |
·基于计算机表示的项目分类 | 第47页 |
·基于计算机表示的项目聚类方法 | 第47-50页 |
·基于误差反传算法的前馈神经网络 | 第47-49页 |
·神经网络的训练与申报书聚类的实现 | 第49-50页 |
·项目申报书在计算机内的组织方式与知识表示 | 第50-51页 |
·项目申报书的查重处理 | 第51-52页 |
第5章 系统设计与实施 | 第52-58页 |
·系统组成与设计 | 第52-55页 |
·分词词典 | 第52-53页 |
·文本分词模块 | 第53页 |
·汉明码字库集 | 第53-54页 |
·领域划分模块 | 第54页 |
·申报书聚类模块 | 第54-55页 |
·申报书查重模块 | 第55页 |
·系统实施 | 第55-56页 |
·待解决的问题 | 第56-58页 |
结论 | 第58-59页 |
参考文献 | 第59-61页 |
后记 | 第61页 |