教育新闻网页信息抽取系统的设计与实现
摘要 | 第1-6页 |
Abstract | 第6-7页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-15页 |
·研究意义和背景 | 第9页 |
·国内外研究现状 | 第9-13页 |
·研究目标与工作 | 第13-14页 |
·论文内容安排 | 第14-15页 |
第二章 网页分块与信息抽取相关技术 | 第15-28页 |
·网页基础 | 第15-19页 |
·HTML | 第15-17页 |
·文档对象模型 DOM | 第17-19页 |
·网页解析 | 第19-22页 |
·信息抽取 | 第22-27页 |
·信息抽取相关技术 | 第22-26页 |
·信息抽取效果评价 | 第26-27页 |
·本章小结 | 第27-28页 |
第三章 教育新闻网页信息抽取系统的设计 | 第28-35页 |
·系统的设计目标 | 第28页 |
·系统总体架构 | 第28-29页 |
·系统模块的组成及设计 | 第29-32页 |
·网页预处理模块设计 | 第30-31页 |
·网页分块模块设计 | 第31页 |
·网页信息抽取模块设计 | 第31-32页 |
·GUI 模块设计 | 第32页 |
·系统的工作流程 | 第32-34页 |
·本章小结 | 第34-35页 |
第四章 教育新闻网页信息抽取系统的实现 | 第35-64页 |
·网页预处理模块 | 第35-39页 |
·网页编码检测 | 第35-38页 |
·网页标准化 | 第38页 |
·网页解析及网页清洗 | 第38-39页 |
·网页分块模块 | 第39-41页 |
·信息抽取模块 | 第41-61页 |
·信息抽取规则建立 | 第42-47页 |
·网页信息提取 | 第47-61页 |
·GUI 模块 | 第61-63页 |
·本章小结 | 第63-64页 |
第五章 实验结果及分析 | 第64-76页 |
·实验目的 | 第64页 |
·实验环境 | 第64页 |
·系统数据集的建立 | 第64-65页 |
·基于规则的新闻关键信息抽取结果 | 第65-70页 |
·新闻发布时间的抽取 | 第65-67页 |
·新闻标题的抽取 | 第67-69页 |
·新闻信息来源的抽取 | 第69-70页 |
·基于 HMM 的信息抽取实验结果 | 第70-75页 |
·本章小结 | 第75-76页 |
总结与展望 | 第76-78页 |
参考文献 | 第78-81页 |
攻读硕士学位期间取得的研究成果 | 第81-82页 |
致谢 | 第82-83页 |
附件 | 第83页 |