首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于元数据的web信息提取方法研究

1 引言第1-13页
   ·课题目的第8页
   ·国内外研究状况第8-10页
   ·基于元数据的web信息提取的难点第10-11页
     ·文本的表示形式第10-11页
     ·元数据标准及内容的确定第11页
   ·本文应用价值第11页
   ·内容安排第11-13页
2 相关理论第13-19页
   ·元数据简介第13-15页
     ·元数据定义第13页
     ·web文本元数据的表示第13-15页
   ·相关术语第15-19页
     ·文本状态术语第15-16页
     ·文本统计术语第16页
     ·模糊论术语第16-19页
3 语义性元数据项提取第19-28页
   ·web页面分析第19页
   ·web文本的表示第19-21页
     ·文本段的表示第19-20页
     ·文本句词的表示第20页
     ·文本表示形式的实现第20-21页
   ·简单语句向量空间的生成第21-23页
     ·简单语句向量术语描述第21-22页
     ·简单语句向量生成算法第22-23页
   ·简单语句模糊相似矩阵的生成第23-24页
     ·模糊相似矩阵相关术语描述第23页
     ·模糊相似矩阵生成算法第23-24页
   ·利用文本的矩阵表示提取语义性元数据项第24-28页
     ·DC.title题目提取过程:第24页
     ·DC.creater作者提取过程:第24-25页
     ·DC.subject主题词提取过程:第25-26页
     ·DC.type体裁算法设计和实现第26-28页
4 DC.description内容元数据项提取第28-43页
   ·内容元数据项提取考虑以下几点第28页
   ·本文内容元数据项的特点第28-29页
   ·利用简单语句向量空间提取DC.description元数据项第29-30页
   ·矩阵及模糊论相结合提取内容元数据项第30-43页
     ·内容元数据项提取总原则第30页
     ·冗长句处理第30-31页
     ·冗长段处理第31-37页
     ·DC.description填写第37-43页
5 系统及实验第43-48页
   ·系统框图第43-44页
   ·试验方法及结果第44-45页
   ·DC.description元数据项实验结果与分析第45-46页
     ·平面聚类实验结果第45-46页
     ·C_均值聚类实验结果与分析第46页
   ·题材试验结果与分析第46-48页
6 结束语与展望第48-49页
致谢第49-50页
参考文献第50-52页
附录第52页

论文共52页,点击 下载论文
上一篇:砷的原子荧光光谱法改进及其在胶州湾、黄、东海的应用
下一篇:海洋低温碱性蛋白酶的化学特性研究