基于RSS和本体语义适配的自治主题页面采集

摘要	第1-3页
Abstract	第3-8页
1 引言	第8-13页
·本文研究背景及意义	第8-9页
·国内外研究现状	第9-10页
·研究内容与系统框架	第10-12页
·研究内容	第10-11页
·系统框架	第11-12页
·论文章节安排	第12-13页
2 面向特定主题的页面采集	第13-42页
·应用背景	第13页
·DOM解析器	第13-17页
·研究现状	第13-14页
·存在的主要问题	第14-16页
·发展趋势	第16页
·DOM解析	第16-17页
·基于HPath的HTML抽取技术	第17-24页
·HPath抽取技术简介	第17-18页
·数据块与HPath的对应关系	第18-20页
·HPath生成和定位算法	第20-24页
·异构DOM集成	第24-29页
·异构DOM现象	第24-25页
·基于HPath的集成方法	第25-29页
·基于异构DOM集成的页面采集	第29-30页
·RSS技术研究	第30-35页
·Web2.0网络简介	第31-32页
·RSS简介	第32-33页
·RSS研究现状	第33-34页
·存在的问题	第34-35页
·发展趋势	第35页
·RSS应用	第35-36页
·RSS的联合(Syndication)	第35-36页
·RSS的聚合(Aggregation)	第36页
·RSS的未来发展	第36页
·RSS资源的收集	第36-39页
·手工收集	第36-37页
·爬虫收集	第37-38页
·OPML收集	第38-39页
·RSS的解析	第39-42页
·XML简介	第39-40页
·XML解析	第40页
·XPath查询	第40-42页
3 基于本体的语义适配	第42-67页
·主题页面采集的语义失配问题	第42页
·基于本体的语义适配解决方案	第42-57页
·本体理论简介	第42-45页
·本体研究的对象及组成	第45页
·本体的分类	第45-46页
·构建本体的语言	第46-48页
·构建本体的规则	第48页
·构建本体的工具	第48-52页
·构建本体的主要方法	第52-55页
·本体的优势	第55-57页
·基于语义适配的主题页面分类框架	第57页
·语义距离的计算	第57-63页
·语义距离的概念	第57-58页
·弹性匹配	第58-59页
·概率匹配	第59-60页
·长度距离	第60-62页
·深度距离	第62-63页
·相似度的计算	第63-65页
·相似度的概念	第63-64页
·计算相似度	第64-65页
·小结	第65-67页
4 基于ECA的自治系统框架设计	第67-84页
·采集系统的自治需求	第67页
·自治计算研究	第67-71页
·ECA与知识表达	第71-74页
·ECA语法	第72-73页
·ECA语义	第73页
·ECA的使用	第73-74页
·监视事件	第74-76页
·事件分析	第76-77页
·计划制定与执行	第77页
·自治页面采集系统框架	第77-78页
·实验数据	第78-84页
5 总结和展望	第84-85页
·论文的创新点及主要工作	第84页
·进一步的研究工作	第84-85页
参考文献	第85-90页
致谢	第90-91页