开放存取期刊站点信息抽取与自动分类方法研究

摘要	第1-6页
Abstract	第6-9页
第1章绪论	第9-15页
·课题背景与意义	第9-10页
·国内外研究现状	第10-13页
·深层 Web 资源发展现状	第10-11页
·信息抽取研究现状	第11-12页
·文本分类研究现状	第12-13页
·课题主要研究内容	第13-14页
·本文的组织结构	第14-15页
第2章相关理论知识与技术	第15-25页
·Web 信息抽取技术	第15-17页
·信息抽取简介	第15页
·Web 信息抽取方法	第15-17页
·文本分类技术	第17-24页
·问题描述	第17-18页
·文本预处理	第18-19页
·文本表示	第19页
·特征选择	第19-21页
·特征权值计算方法	第21-22页
·分类方法	第22-24页
·本章小结	第24-25页
第3章面向 OA 期刊站点的信息抽取方法	第25-37页
·面向 OA 期刊站点的信息抽取框架	第25-26页
·站点特征分析	第26-29页
·种子站点分析	第27页
·OA 期刊站点分析	第27-29页
·种子站点 URL 抽取	第29-30页
·URL 定位与抽取	第29页
·种子站点 URL 抽取算法	第29-30页
·OA 期刊站点标题正文提取	第30-33页
·OA 期刊站点标题抽取	第30-31页
·OA 期刊站点正文抽取	第31-32页
·OA 期刊站点信息抽取算法	第32-33页
·更新规则	第33页
·实验与分析	第33-35页
·种子站点 URL 抽取实验	第33-34页
·OA 期刊站点正文抽取实验	第34-35页
·本章小结	第35-37页
第4章 OA 期刊站点自动分类方法	第37-47页
·问题分析	第37页
·基于标题的 OA 期刊站点自动分类	第37-40页
·创建 OA 期刊站点语料库	第37-39页
·关联度计算	第39页
·分类步骤	第39-40页
·基于 DAG-SVM 的自动分类	第40-44页
·网页向量化表示	第40-41页
·SVM 用于多分类	第41-42页
·基于欧式距离的 DAG-SVM 构建方法	第42-44页
·实验与分析	第44-46页
·实验评价指标	第44-45页
·实验结果与分析	第45-46页
·本章小结	第46-47页
第5章系统实现	第47-55页
·开发环境	第47页
·系统总体框架与模块设计	第47-54页
·种子站点 URL 抽取模块	第48-49页
·OA 期刊站点标题正文抽取模块	第49-51页
·语料库构建模块	第51-52页
·基于标题的 OA 期刊站点自动分类模块	第52-54页
·本章小结	第54-55页
结论	第55-57页
参考文献	第57-61页
攻读硕士期间承担的科研任务与主要成果	第61-62页
致谢	第62-63页
作者简介	第63页