首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

藏文网页自动发现与采集技术研究

摘要第1-5页
Abstract第5-10页
第一章 绪论第10-14页
   ·课题背景及研究的目的和意义第10页
   ·课题在国内外研究状况第10-12页
     ·国外的研究状况第10-11页
     ·国内的研究状况第11-12页
     ·新研究需求的产生第12页
   ·论文的主要研究内容第12-13页
     ·论文的技术路线第12页
     ·论文的主要工作难点第12-13页
     ·试验设计方案第13页
   ·论文的组织结构第13-14页
第二章 工作基础第14-26页
   ·分析网页自动发现与采集面临的主要问题第14-16页
     ·网页的规模第14页
     ·采集的效率第14-15页
     ·网页信息的提取第15页
     ·网页的识别和判定第15页
     ·网页编码的多样性第15-16页
   ·分析网页信息采集的关键技术第16-21页
     ·网页主题相关性判定第16-18页
     ·网页信息采集策略第18-20页
     ·网页采集线程调度策略第20-21页
   ·网页采集系统的基本原理与功能结构第21-25页
     ·基本原理第21-22页
     ·功能需求第22页
     ·体系结构第22-23页
     ·访问规范第23-24页
     ·网页采集流程第24-25页
   ·本章小结第25-26页
第三章 藏文网页自动发现与采集技术第26-50页
   ·藏文的特点第26-27页
   ·藏文网页的识别第27-30页
     ·基于藏文网页文本节点特征的识别方法第27页
     ·基于藏文文字音节点特征的识别方法第27-28页
     ·基于藏文高频音节统计学特征的识别方法第28-29页
     ·识别方案的构建和分析第29-30页
   ·藏文网页编码的识别与转换第30-41页
     ·藏文网页编码转换的必要性第30页
     ·藏文编码类型与范围第30-32页
     ·藏文编码模式分析第32页
     ·藏文网页编码的识别方法第32-35页
     ·藏文网页编码的转换方案设计第35-41页
   ·藏文网页的判定第41-44页
     ·阈值的选取第41-43页
     ·藏文网页的判定算法第43页
     ·算法的性能和对比分析第43-44页
   ·藏文网页自动发现与采集技术第44-49页
     ·藏文网页种子URL 的选取第44页
     ·藏文网页采集策略第44-45页
     ·藏文网页HTML 解析第45-47页
     ·藏文网页存储技术第47-49页
   ·本章小结第49-50页
第四章 藏文网页自动发现与采集系统的初步实现第50-67页
   ·TS 系统框架第50页
   ·各功能模块的设计与实现第50-59页
     ·TS 系统网络模块第51-52页
     ·系统数据库模块第52-53页
     ·藏文网页识别模块第53-55页
     ·藏文网页编码转换模块第55-58页
     ·其他辅助模块第58-59页
   ·系统测试结果第59-67页
     ·藏文网页采集和搜索测试第59-61页
     ·藏文网页存储测试第61-63页
     ·藏文网页识别和编码转换测试第63-67页
第五章 结束语第67-69页
   ·总结第67-68页
   ·展望第68-69页
参考文献第69-72页
在校期间研究成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:藏文网页除噪技术研究
下一篇:基于数据场的聚类可视化算法研究与应用