首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于维基百科的双语语料挖掘技术研究

中文摘要第1-5页
Abstract第5-8页
第一章 引言第8-22页
   ·概述第8-15页
   ·相关技术及资源第15-19页
   ·主要研究目标和内容第19-21页
   ·论文组织结构第21-22页
第二章 基于维基百科的双语语料库挖掘的总体架构第22-26页
   ·基本流程第22-23页
   ·任务分析与界定第23-25页
   ·本章小结第25-26页
第三章 中英文双语网页URL 获取第26-36页
   ·研究现状第26页
   ·网页间平行或可比较语料获取途径第26-27页
   ·网页解析与去噪声第27-28页
   ·双语平行或可比较网页URL 命名模板第28-34页
   ·获取具有 URL 命名相似性的双语候选网页算法第34-35页
   ·本章小结第35-36页
第四章 中英文双语平行或可比较网页确认第36-43页
   ·相关研究第36-37页
   ·基于最大熵分类器的双语平行或可比较网页获取第37-42页
   ·本章小结第42-43页
第五章 中英文双语平行或可比较句对挖掘第43-56页
   ·相关研究第43-44页
   ·双语平行或可比较句对挖掘模型第44-48页
   ·基于网页结构相似性的平行或可比较句对获取第48-55页
   ·本章小结第55-56页
第六章 双语语料库挖掘实验平台第56-63页
   ·主要模块介绍第56-57页
   ·模块间的数据传递第57-58页
   ·实验性能评估第58页
   ·实验与分析第58-61页
   ·实验成果第61-62页
   ·本章小结第62-63页
第七章 总结第63-66页
   ·总结第63-64页
   ·下一步工作第64-66页
附录一 HTML特殊字符转换表第66-67页
参考文献第67-71页
攻读学位期间公开发表的论文第71-72页
致谢第72-73页

论文共73页,点击 下载论文
上一篇:基于数据挖掘的高校图书馆借阅数据特性分析与应用
下一篇:语言学特征在中文命名实体间语义关系抽取中的应用研究