首页--文化、科学、教育、体育论文--信息与知识传播论文--档案学、档案事业论文--各种类型档案工作论文--技术档案论文

科技文档的分类与查重

中文摘要第1-5页
英文摘要第5-8页
第1章 绪论第8-14页
   ·本文研究的目的第8-9页
     ·本文研究的目的第8-9页
     ·本文研究的意义第9页
   ·国内外的研究现状第9-13页
     ·科技文档分类第9-10页
     ·文本相似度计算第10-11页
     ·中文分词技术第11-13页
   ·本文的创新之处及内容安排第13-14页
     ·本文的创新之处第13页
     ·本文的内容安排第13-14页
第2章 对项目申报书的分词第14-21页
   ·对申报书分词前的预处理第14页
   ·具体分词算法与消歧处理第14-21页
     ·分词词典存储格式第14-15页
     ·改进的MM 方法第15-18页
     ·歧义词处理第18-19页
     ·多义字处理第19页
     ·未登录词的处理第19-21页
第3章 中文文本相似度计算第21-33页
   ·中文文本相似度计算模型第21-22页
     ·相似度第21-22页
     ·相似算法第22页
   ·中文文本相似度计算的主要方法第22-30页
     ·隐性语义标引第22-24页
     ·基于向量空间模型的TF-IDF 方法第24-26页
     ·基于语义理解的相似度计算方法第26页
     ·基于属性论的文本相似度计算方法第26-29页
     ·基于汉明距离的文本相似度计算方法第29-30页
   ·文本相似度计算方法的选择第30-32页
   ·存在问题及发展方向第32-33页
     ·存在的问题第32页
     ·未来的发展方向第32-33页
第4章 科技项目的计算机表示与分类、查重第33-52页
   ·知识表示的相关方法第33-42页
     ·产生式规则表示第33-35页
     ·语义网络表示第35-38页
     ·框架表示第38-40页
     ·面向对象表示第40-42页
   ·科技项目的计算机表示第42-43页
   ·科技项目的分类规则与特点第43-47页
     ·项目分类的必要性第43-45页
     ·科技项目分类评价原则第45-46页
     ·本文所采用的分类标准第46-47页
     ·基于计算机表示的项目分类第47页
   ·基于计算机表示的项目聚类方法第47-50页
     ·基于误差反传算法的前馈神经网络第47-49页
     ·神经网络的训练与申报书聚类的实现第49-50页
   ·项目申报书在计算机内的组织方式与知识表示第50-51页
   ·项目申报书的查重处理第51-52页
第5章 系统设计与实施第52-58页
   ·系统组成与设计第52-55页
     ·分词词典第52-53页
     ·文本分词模块第53页
     ·汉明码字库集第53-54页
     ·领域划分模块第54页
     ·申报书聚类模块第54-55页
     ·申报书查重模块第55页
   ·系统实施第55-56页
   ·待解决的问题第56-58页
结论第58-59页
参考文献第59-61页
后记第61页

论文共61页,点击 下载论文
上一篇:提高织物湿热舒适性方法的研究
下一篇:利用扩张的互补问题求解线性规划的光滑型算法