首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

网络文本数据异构集成技术研究

摘要第3-4页
ABSTRACT第4页
第一章 绪论第8-11页
    1.1 课题研究背景和意义第8-9页
    1.2 国内外研究现状第9页
        1.2.1 国内外网络爬虫研究现状第9页
        1.2.2 国内外数据异构集成技术研究现状第9页
    1.3 研究内容第9-11页
        1.3.1 基于语义分析的网络爬虫第9-10页
        1.3.2 网络文本数据自动分析技术第10页
        1.3.3 数据异构集成技术第10-11页
第二章 相关理论和技术概念第11-14页
    2.1 网络爬虫技术第11页
    2.2 数据异构集成技术第11-12页
    2.3 典型数据集成技术第12-14页
        2.3.1 联邦数据库系统第12页
        2.3.2 数据仓库系统(DataWarehouse)第12-13页
        2.3.3 面向消息的中间件技术第13页
        2.3.4 XML技术第13-14页
第三章 方案设计概念第14-18页
    3.1 数据采集模块第14-15页
        3.1.1 数据抓取模块第14-15页
        3.1.2 语义分析模块第15页
    3.2 数据处理模块第15页
        3.2.1 数据存储第15页
        3.2.2 文件索引第15页
    3.3 数据集成模块第15-18页
        3.3.1 XML生成模块第16页
        3.3.2 XML分析模块第16-17页
        3.3.3 XML关系映射模块第17页
        3.3.4 XML整合模块第17-18页
第四章 TF-IDF改进算法的聚焦网络爬虫研究第18-26页
    4.1 聚焦主题网络爬虫第18页
    4.2 基于语义分析的聚焦主题网络爬虫第18-19页
    4.3 TF-IDF算法改进第19-22页
    4.4 基于语义分析的聚焦主题网络爬虫设计第22-26页
        4.4.1 语义库第22-24页
        4.4.2 数据下载模块第24页
        4.4.3 爬行控制模块第24-26页
第五章 数据异构集成技术第26-29页
    5.1 网络文档数据结构特征提取第26-27页
    5.2 XML文档生成实现第27-28页
    5.3 基于XML数据集成第28-29页
第六章 软件实现第29-47页
    6.1 数据抓取第29-41页
        6.1.1 语义解析器第31-35页
        6.1.2 数据分析和抽取第35页
        6.1.3 TF-IDF改进算法实现第35-41页
    6.2 文件系统和索引系统服务第41-45页
        6.2.1 文件系统服务第42页
        6.2.2 索引系统服务第42-43页
        6.2.3 文件和索引系统服务核心代码第43-45页
    6.3 数据异构集成第45-47页
        6.3.1 XML文件生成第46页
        6.3.2 XML文件分析第46页
        6.3.3 XML文件整合第46-47页
第七章 系统测试和结果分析第47-49页
    7.1 系统测试第47-48页
    7.2 结果分析第48-49页
第八章 结论与展望第49-50页
    8.1 总结和展望第49-50页
参考文献第50-53页
在学期间的研究成果第53-54页
致谢第54页

论文共54页,点击 下载论文
上一篇:OLAP技术在软件著作权登记数据分析中的研究与应用
下一篇:带测地线的两类曲面的逆向设计