首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Web数据库重叠估计技术研究

中文摘要第1-4页
Abstract第4-7页
第一章 引言第7-11页
   ·论文背景第7页
   ·研究意义第7-8页
   ·主要工作第8-9页
   ·论文结构与基本内容第9-11页
第二章 理想情况下的web数据库重叠估计第11-20页
   ·概述第11-12页
     ·问题描述第11页
     ·相关工作第11-12页
   ·朴素的估计方法第12-14页
     ·基本原理第12页
     ·问题的挑战第12-13页
     ·朴素方法的步骤第13页
     ·朴素方法的局限性第13-14页
   ·改进的估计方法第14-19页
     ·Zipf定律第14-15页
     ·汉语中的高频字第15页
     ·获取字段上的高频字第15-18页
     ·改进方法的步骤第18-19页
   ·本章小节第19-20页
第三章 重叠估计中的实体识别第20-30页
   ·概述第20-21页
   ·准备工作第21-25页
     ·字段匹配第21页
     ·领域知识第21-23页
     ·字段预处理第23-25页
   ·实体识别第25-29页
     ·总体思路第25页
     ·字段相似度计算第25页
     ·可查询字段第25-26页
     ·字段权值设定第26-27页
     ·相似度计算第27-28页
     ·阈值设定第28-29页
   ·本章小节第29-30页
第四章 重叠率估计值修正第30-35页
   ·概述第30页
   ·web数据库的相似性第30-31页
   ·估计值修正第31-34页
     ·数据准备第32-33页
     ·修正方法第33-34页
     ·修正结果确定第34页
   ·本章小节第34-35页
第五章 实验及分析第35-48页
   ·概述第35页
   ·重叠率估计实验第35-40页
     ·数据集第35-37页
     ·实验过程及结果第37-40页
   ·实体识别实验第40-43页
     ·数据集第41页
     ·实验过程及结果第41-43页
   ·估计值修正实验第43-47页
     ·数据集第43-44页
     ·实验过程及结果第44-47页
   ·本章小节第47-48页
第六章 总结与展望第48-50页
   ·总结第48页
   ·展望第48-50页
参考文献第50-54页
攻读硕士学位期间公开发表的论文及参与的项目第54-55页
致谢第55-56页
详细摘要第56-58页

论文共58页,点击 下载论文
上一篇:一个WEB文本过滤系统设计与实现
下一篇:汉语并列结构的自动识别