首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络双语语料挖掘关键技术研究

摘要第1-7页
ABSTRACT第7-9页
目录第9-12页
第一章 绪论第12-30页
   ·研究背景和意义第12-18页
     ·语料库第12-13页
     ·双语语料库第13-15页
     ·双语语料库挖掘意义第15-18页
   ·国内外研究现状第18-25页
     ·Web平行语料挖掘现状第18-21页
     ·Web可比语料挖掘现状第21-24页
     ·语料质量评价第24-25页
   ·主要研究内容第25-26页
   ·论文基本结构第26-30页
第二章 网络平行语料挖掘系统设计与实现第30-42页
   ·网络平行语料挖掘整体框架第30-31页
   ·网络平行语料挖掘第31-37页
     ·候选资源获取与预处理第31-32页
     ·平行网页识别第32-37页
     ·双语句对齐第37页
   ·实验结果与分析第37-40页
     ·测试样本和评价标准第37-38页
     ·结果与分析第38-40页
   ·本章小结第40-42页
第三章 网络可比语料挖掘系统设计与框架第42-52页
   ·相关模型概述第42-47页
     ·标准LDA模型第42-45页
     ·Bi-LDA模型第45-47页
   ·网络可比语料挖掘整体框架设计第47-49页
   ·网络可比语料挖掘关键技术分析第49-50页
   ·本章小结第50-52页
第四章 基于文本密度模型的Web正文抽取第52-64页
   ·相关工作第52-53页
   ·正文抽取系统第53-59页
     ·文本密度计算第54-57页
     ·平滑文本密度第57-58页
     ·正文内容分割第58-59页
   ·实验与分析第59-62页
     ·测试样本与评价标准第59-60页
     ·结果与分析第60-62页
   ·本章小结第62-64页
第五章 基于LDA模型的文本关键词提取第64-78页
   ·相关工作第65-66页
   ·关键词提取第66-71页
     ·基本流程第66-68页
     ·TFITF权值计算第68-69页
     ·候选关键词合并第69-70页
     ·冗余短语消除第70-71页
   ·实验与分析第71-76页
     ·测试样本和评价标准第71-72页
     ·结果与分析第72-76页
   ·本章小结第76-78页
第六章 基于Bi-LDA模型的跨语言文本相似度计算第78-90页
   ·相关研究第78-79页
   ·跨语言文本匹配第79-84页
     ·基本流程第79-81页
     ·KL散度第81页
     ·余弦相似度第81-82页
     ·条件概率第82-84页
   ·实验结果与分析第84-87页
     ·测试样本与评价标准第84-85页
     ·实验结果与分析第85-87页
   ·本章小结第87-90页
第七章 总结和展望第90-94页
   ·论文的主要贡献第90-91页
   ·工作展望第91-94页
参考文献第94-106页
致谢第106-108页
在读期间发表的学术论文与取得的其他研究成果第108-109页

论文共109页,点击 下载论文
上一篇:无线物理层多播中的预编码技术研究
下一篇:图像直方图特征及其应用研究