首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网双语资源挖掘关键技术研究

中文摘要第1-5页
Abstract第5-9页
第一章 绪论第9-19页
   ·概述第9-15页
     ·研究背景第9-10页
     ·国内外研究现状和相关工作第10-15页
   ·主要研究目标和内容第15-17页
     ·研究目标第15-16页
     ·研究内容第16-17页
   ·论文组织结构第17-19页
第二章 基于关键词索引网页去重算法第19-35页
   ·网页去重技术的研究目的和意义第19-21页
   ·网页去重的研究现状与相关工作第21-23页
   ·网页去重的总体流程第23-24页
   ·网页的计算度量第24-25页
   ·关键词抽取算法第25-31页
     ·三种关系之间的计算第26-28页
     ·相互促进算法第28-29页
     ·迭代初值的选取第29-31页
   ·实验与结果与分析第31-34页
     ·实验结果评价方法第31-32页
     ·测试语料准备第32页
     ·实验结果比较与分析第32-34页
   ·本章小结第34-35页
第三章 网页间双语平行文本挖掘第35-46页
   ·算法总体流程第35-36页
   ·双语网页候选URL 对获取第36-39页
     ·双语网页候选URL 对获取分析第36-37页
     ·双语网页候选URL 对获取流程第37-39页
   ·网页间双语平行网页的鉴定第39-43页
     ·特征抽取第39-42页
     ·模型预测与训练第42-43页
   ·双语网站的判别第43页
   ·实验和结果分析第43-45页
     ·训练语料准备和评价方法第43-44页
     ·实验结果第44页
     ·双语网站判别算法实验分析第44-45页
   ·本章小结第45-46页
第四章 双语混合网页内双语平行句对抽取第46-60页
   ·简介第46-47页
   ·候选双语混合网页选取第47-48页
   ·候选双语资源选取第48-50页
     ·文本预处理第48-49页
     ·从网页块获取双语资源第49-50页
   ·双语句对抽取第50-53页
     ·句对预处理第51页
     ·长度测度第51-52页
     ·互译单词重叠度第52页
     ·M-N 节点对齐第52-53页
   ·双语句对鉴别第53-55页
   ·实验设计与结果分析第55-59页
     ·系统总体评测第56-57页
     ·分类器采用的特征组成评测第57-58页
     ·双语资源候选算法评测第58页
     ·网页分块对双语句对挖掘的影响第58-59页
   ·本章小结第59-60页
第五章 总结与展望第60-63页
   ·总结第60-61页
   ·研究展望第61-63页
参考文献第63-69页
攻读学位期间公开发表的论文第69-70页
致谢第70-71页

论文共71页,点击 下载论文
上一篇:电子商务安全协议的一种形式化分析方法
下一篇:基于CPCI的Ethernet-V.35协议转换器设计