首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于超大规模问答对库和语音界面的非受限领域自动问答系统研究

摘要第1-7页
ABSTRACT第7-10页
目录第10-14页
第一章 绪论第14-35页
   ·自动问答系统研究背景第15-21页
     ·概述第15-16页
     ·研究历史回顾第16-18页
     ·自动问答系统技术分类第18-21页
   ·自动问答系统技术第21-26页
     ·基于信息检索的自动问答技术第21-25页
     ·基于问答对库的自动问答技术第25-26页
     ·Entity Search技术第26页
   ·语音界面的信息检索及自动问答系统第26-28页
     ·语音界面的信息检索第26-27页
     ·语音界面的自动问答系统第27-28页
   ·基于问答对库的问答系统的技术优势和时代机遇第28-31页
     ·技术优势第28-30页
     ·时代机遇第30-31页
   ·论文的研究目标和内容第31-33页
   ·本文的组织第33-35页
第二章 互联网上问答对的自动抽取第35-50页
   ·FAQ页面中问答对自动提取第35-46页
     ·问题描述第35-38页
       ·建立网页的DOM树第38-39页
     ·基于决策树的问答对抽取模型第39-41页
       ·分类模型建立第39-40页
       ·特征的选择第40-41页
     ·进一步引入马尔科夫模型的问答对抽取第41-43页
       ·仅基于决策树方式的缺陷第41-42页
       ·利用一阶马尔可夫链修正结果第42页
       ·对整个网页的所有判断结果进行问答对的选择第42-43页
       ·面向精度的问答对取舍第43页
     ·问答对抽取实验结果第43-44页
       ·评测指标第43页
       ·数据集第43-44页
       ·实验结果第44页
     ·大规模问答对库的建立第44-46页
   ·百度知道网站中问答对的自动抽取第46-47页
   ·本章小结第47-48页
 附:大规模页面搜索和下载工具iFlycrawler第48-50页
第三章 基于超大规模问答对库的问答系统第50-80页
   ·问题定义第51-53页
     ·概述第51-52页
     ·相关研究第52-53页
   ·实验数据准备第53-61页
     ·评测指标第56-57页
     ·实验数据统计分析第57-60页
     ·研究思路第60-61页
   ·基线系统的确定第61-68页
     ·三种候选的基线排序函数第61-64页
       ·基于向量空间模型的TFIDF方法第61-62页
       ·Okapi的BM25排序函数第62页
       ·基于语言模型的排序函数第62-63页
       ·实验结果第63-64页
     ·中文分词处理第64-68页
       ·分词算法第65-66页
       ·分词词典第66页
       ·实验结果第66-68页
   ·问答系统的改进第68-74页
     ·统一的排序函数设计及其参数优化第68-71页
       ·统一的排序函数设计第68-69页
       ·参数优化实验结果第69-71页
     ·有监督训练的排序函数第71-74页
       ·改进的爬山算法第71-72页
       ·特征抽取第72-73页
       ·有监督训练实验结果第73-74页
   ·置信度问题研究第74-76页
   ·本章小结第76-77页
 附录一:词典建设第77-78页
 附录二:未登录词识别第78-80页
第四章 自动问答系统的语音界面扩展第80-98页
   ·语音界面的问答系统第80-84页
     ·简介第80-81页
     ·价值和挑战第81-82页
     ·相关研究第82-84页
       ·语音驱动的网页检索系统第83页
       ·语音驱动的问答系统第83页
       ·基于语音对话系统及语音到语音的机器翻译系统第83-84页
   ·SpeechQoogle系统第84页
   ·语音识别第84-89页
     ·系统构成第84-86页
     ·实验设置第86页
     ·实验结果第86-89页
       ·声学模型实验第86-87页
       ·语言模型实验第87-89页
   ·语音识别与问答系统的集成第89-96页
     ·基线系统第89-90页
     ·语音识别率与问答系统性能的关系第90-91页
     ·改进实验第91-95页
       ·识别置信度第92-93页
       ·拼音层面识别结果第93-94页
       ·多候选的识别结果第94-95页
       ·实验小结第95页
     ·有监督的排序函数训练第95-96页
   ·语音合成模块第96页
   ·本章小结第96-98页
第五章 总结第98-101页
   ·主要研究内容和创新点第98-99页
   ·未来研究方向展望第99-101页
参考文献第101-107页
攻读博士学位期间发表的论文和参与的研究工作第107-110页
 发表论文第107-108页
 研究工作第108-110页
致谢第110页

论文共110页,点击 下载论文
上一篇:广德地区滑坡危险度区划的研究
下一篇:图像的符号学分析--以可口可乐广告为例