教育新闻网页信息抽取系统的设计与实现
| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 目录 | 第7-9页 |
| 第一章 绪论 | 第9-15页 |
| ·研究意义和背景 | 第9页 |
| ·国内外研究现状 | 第9-13页 |
| ·研究目标与工作 | 第13-14页 |
| ·论文内容安排 | 第14-15页 |
| 第二章 网页分块与信息抽取相关技术 | 第15-28页 |
| ·网页基础 | 第15-19页 |
| ·HTML | 第15-17页 |
| ·文档对象模型 DOM | 第17-19页 |
| ·网页解析 | 第19-22页 |
| ·信息抽取 | 第22-27页 |
| ·信息抽取相关技术 | 第22-26页 |
| ·信息抽取效果评价 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 第三章 教育新闻网页信息抽取系统的设计 | 第28-35页 |
| ·系统的设计目标 | 第28页 |
| ·系统总体架构 | 第28-29页 |
| ·系统模块的组成及设计 | 第29-32页 |
| ·网页预处理模块设计 | 第30-31页 |
| ·网页分块模块设计 | 第31页 |
| ·网页信息抽取模块设计 | 第31-32页 |
| ·GUI 模块设计 | 第32页 |
| ·系统的工作流程 | 第32-34页 |
| ·本章小结 | 第34-35页 |
| 第四章 教育新闻网页信息抽取系统的实现 | 第35-64页 |
| ·网页预处理模块 | 第35-39页 |
| ·网页编码检测 | 第35-38页 |
| ·网页标准化 | 第38页 |
| ·网页解析及网页清洗 | 第38-39页 |
| ·网页分块模块 | 第39-41页 |
| ·信息抽取模块 | 第41-61页 |
| ·信息抽取规则建立 | 第42-47页 |
| ·网页信息提取 | 第47-61页 |
| ·GUI 模块 | 第61-63页 |
| ·本章小结 | 第63-64页 |
| 第五章 实验结果及分析 | 第64-76页 |
| ·实验目的 | 第64页 |
| ·实验环境 | 第64页 |
| ·系统数据集的建立 | 第64-65页 |
| ·基于规则的新闻关键信息抽取结果 | 第65-70页 |
| ·新闻发布时间的抽取 | 第65-67页 |
| ·新闻标题的抽取 | 第67-69页 |
| ·新闻信息来源的抽取 | 第69-70页 |
| ·基于 HMM 的信息抽取实验结果 | 第70-75页 |
| ·本章小结 | 第75-76页 |
| 总结与展望 | 第76-78页 |
| 参考文献 | 第78-81页 |
| 攻读硕士学位期间取得的研究成果 | 第81-82页 |
| 致谢 | 第82-83页 |
| 附件 | 第83页 |