基于超大规模问答对库和语音界面的非受限领域自动问答系统研究

摘要	第1-7页
ABSTRACT	第7-10页
目录	第10-14页
第一章绪论	第14-35页
·自动问答系统研究背景	第15-21页
·概述	第15-16页
·研究历史回顾	第16-18页
·自动问答系统技术分类	第18-21页
·自动问答系统技术	第21-26页
·基于信息检索的自动问答技术	第21-25页
·基于问答对库的自动问答技术	第25-26页
·Entity Search技术	第26页
·语音界面的信息检索及自动问答系统	第26-28页
·语音界面的信息检索	第26-27页
·语音界面的自动问答系统	第27-28页
·基于问答对库的问答系统的技术优势和时代机遇	第28-31页
·技术优势	第28-30页
·时代机遇	第30-31页
·论文的研究目标和内容	第31-33页
·本文的组织	第33-35页
第二章互联网上问答对的自动抽取	第35-50页
·FAQ页面中问答对自动提取	第35-46页
·问题描述	第35-38页
·建立网页的DOM树	第38-39页
·基于决策树的问答对抽取模型	第39-41页
·分类模型建立	第39-40页
·特征的选择	第40-41页
·进一步引入马尔科夫模型的问答对抽取	第41-43页
·仅基于决策树方式的缺陷	第41-42页
·利用一阶马尔可夫链修正结果	第42页
·对整个网页的所有判断结果进行问答对的选择	第42-43页
·面向精度的问答对取舍	第43页
·问答对抽取实验结果	第43-44页
·评测指标	第43页
·数据集	第43-44页
·实验结果	第44页
·大规模问答对库的建立	第44-46页
·百度知道网站中问答对的自动抽取	第46-47页
·本章小结	第47-48页
附:大规模页面搜索和下载工具iFlycrawler	第48-50页
第三章基于超大规模问答对库的问答系统	第50-80页
·问题定义	第51-53页
·概述	第51-52页
·相关研究	第52-53页
·实验数据准备	第53-61页
·评测指标	第56-57页
·实验数据统计分析	第57-60页
·研究思路	第60-61页
·基线系统的确定	第61-68页
·三种候选的基线排序函数	第61-64页
·基于向量空间模型的TFIDF方法	第61-62页
·Okapi的BM25排序函数	第62页
·基于语言模型的排序函数	第62-63页
·实验结果	第63-64页
·中文分词处理	第64-68页
·分词算法	第65-66页
·分词词典	第66页
·实验结果	第66-68页
·问答系统的改进	第68-74页
·统一的排序函数设计及其参数优化	第68-71页
·统一的排序函数设计	第68-69页
·参数优化实验结果	第69-71页
·有监督训练的排序函数	第71-74页
·改进的爬山算法	第71-72页
·特征抽取	第72-73页
·有监督训练实验结果	第73-74页
·置信度问题研究	第74-76页
·本章小结	第76-77页
附录一:词典建设	第77-78页
附录二:未登录词识别	第78-80页
第四章自动问答系统的语音界面扩展	第80-98页
·语音界面的问答系统	第80-84页
·简介	第80-81页
·价值和挑战	第81-82页
·相关研究	第82-84页
·语音驱动的网页检索系统	第83页
·语音驱动的问答系统	第83页
·基于语音对话系统及语音到语音的机器翻译系统	第83-84页
·SpeechQoogle系统	第84页
·语音识别	第84-89页
·系统构成	第84-86页
·实验设置	第86页
·实验结果	第86-89页
·声学模型实验	第86-87页
·语言模型实验	第87-89页
·语音识别与问答系统的集成	第89-96页
·基线系统	第89-90页
·语音识别率与问答系统性能的关系	第90-91页
·改进实验	第91-95页
·识别置信度	第92-93页
·拼音层面识别结果	第93-94页
·多候选的识别结果	第94-95页
·实验小结	第95页
·有监督的排序函数训练	第95-96页
·语音合成模块	第96页
·本章小结	第96-98页
第五章总结	第98-101页
·主要研究内容和创新点	第98-99页
·未来研究方向展望	第99-101页
参考文献	第101-107页
攻读博士学位期间发表的论文和参与的研究工作	第107-110页
发表论文	第107-108页
研究工作	第108-110页
致谢	第110页