基于Web信息自动抽取的英语题库生成算法研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-14页
·背景、研究目的及意义	第8-9页
·国内外发展情况	第9-12页
·本文的主要工作及内容安排	第12-14页
2 总体方案设计	第14-19页
·自动获取网页	第15页
·预处理	第15-16页
·网页聚类	第16页
·模板生成	第16页
·信息匹配	第16-17页
·题库生成	第17-18页
·小结	第18-19页
3 网页聚类	第19-31页
·相关知识	第19-22页
·DOM 树的编辑距离	第22-26页
·网页聚类算法	第26-30页
·小结	第30-31页
4 模板生成算法	第31-42页
·HTML 文档匹配多个模板树	第31-34页
·正则表达式	第34-36页
·从多序列比对推导模型	第36-37页
·模板的简化	第37-38页
·最优化模板的建立	第38-40页
·生成模板	第40页
·试卷信息匹配	第40-41页
·小结	第41-42页
5 系统设计	第42-50页
·总体设计	第42-43页
·系统实现	第43-49页
·小结	第49-50页
6 测试结果及分析	第50-55页
·评价标准	第50-51页
·网页聚类测试及分析	第51-52页
·模板生成算法测试及分析	第52-53页
·试卷信息抽取测试及分析	第53-54页
·小结	第54-55页
7 总结与展望	第55-58页
·总结	第55-56页
·展望	第56-58页
致谢	第58-59页
参考文献	第59-63页
附录1 攻读硕士学位期间发表的论文目录	第63页