首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web长期保存的困扰研究

摘要第4-5页
Abstract第5页
1 引言第9-12页
    1.1 研究背景第9页
    1.2 国内外发展现状第9-11页
    1.3 研究方法和创新之处第11-12页
        1.3.1 研究方法第11页
        1.3.2 创新之处第11-12页
2 Web存档相关概述第12-18页
    2.1 Web存档的概念第12页
    2.2 Web存档的意义第12-13页
    2.3 Web存档的挑战第13-15页
    2.4 关键的Web存档措施第15页
    2.5 Web存档的技术方法第15-18页
3 Web保存的运用第18-24页
    3.1 Web存档系统第18-19页
        3.1.1 PANDAS第18-19页
        3.1.2 WCT第19页
    3.2 第三方服务第19-21页
        3.2.1 Archive-It第20页
        3.2.2 加利福尼亚数字图书馆的WAS第20-21页
    3.3 网络爬虫第21页
    3.4 搜索第21-22页
    3.5 访问第22-23页
    3.6 其他的选择第23-24页
4 Web长期保存的困扰第24-35页
    4.1 技术方面的困扰第24-27页
        4.1.1 网页采集工具的局限性第24页
        4.1.2 Web存档的真实性第24-25页
        4.1.3 时间一致性问题第25-26页
        4.1.4 存档格式的有效性第26-27页
        4.1.5 永久保存的标准第27页
    4.2 管理方面的困扰第27-31页
        4.2.1 存档内容的选取第27-28页
        4.2.2 存档的合法性第28-29页
        4.2.3 恶意软件的去留第29-30页
        4.2.4 网页的去重第30-31页
    4.3 新型Web2.0 网站的保存困扰第31-35页
        4.3.1 网站抓取的困扰第31-32页
        4.3.2 产权许可的困扰第32页
        4.3.3 存档动机的缺失第32-35页
5 案例第35-40页
    5.1 英国档案馆第35-37页
        5.1.1 The UK Archive背景第35页
        5.1.2 The UK Archive协作第35页
        5.1.3 The UK Archive方法第35-36页
        5.1.4 The UK Archive技术解决方案第36页
        5.1.5 The UK Archive访问第36页
        5.1.6 The UK Archive收集第36-37页
    5.2 IMF(互联网记忆基金会)第37-40页
        5.2.1 IMF背景第37页
        5.2.2 IMF协作第37页
        5.2.3 IMF方法第37-38页
        5.2.4 IMF技术解决方案第38页
        5.2.5 IMF访问第38页
        5.2.6 IMF收集第38-40页
6 Web存档发展建议第40-43页
    6.1 采集方面第40页
    6.2 资金方面第40-41页
    6.3 法律方面第41页
    6.4 协作方面第41-42页
    6.5 其他方面第42-43页
7 结论和展望第43-45页
参考文献第45-47页
个人简历第47-48页
致谢第48页

论文共48页,点击 下载论文
上一篇:云环境下基于SLA的多任务用户请求资源调度及其利润模型与相关算法的研究
下一篇:Triba拓扑网络嵌入性分析