首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

综合风险垂直搜索引擎的研究与实现

摘要第1-5页
ABSTRACT第5-7页
目录第7-9页
第一章 绪论第9-18页
   ·引言第9-10页
   ·搜索引擎的发展状况第10-16页
     ·搜索引擎发展简史第10-12页
     ·通用搜索引擎第12-14页
     ·垂直搜索引擎第14-15页
     ·垂直搜索研究现状第15-16页
   ·选题背景及研究意义第16-17页
   ·本文的研究内容和论文结构第17-18页
第二章 Web信息检索理论基础第18-26页
   ·信息检索模型第18-19页
   ·信息检索算法第19-24页
     ·基于内容的检索第19-21页
     ·基于超链接的检索第21-24页
   ·本章小结第24-26页
第三章 信息分类——分类器设计第26-42页
   ·Web信息抽取第26-28页
   ·Web文本预处理第28-30页
     ·HTML标记加权第28-29页
     ·中文分词第29-30页
   ·Web文本特征提取第30-31页
     ·向量空间模型及其不足第30-31页
     ·结合HTML标记权重的VSM算法实现第31页
   ·基于遗传算法的Web文本特征选择第31-35页
     ·遗传算法简介第32-33页
     ·交叉算子改进第33-34页
     ·适应度函数选择第34-35页
   ·基于SVM的Web文本分类第35-38页
     ·支持向量机简介第35-37页
     ·支持向量机在Web文本分类中优势第37页
     ·支持向量机算法实现第37-38页
   ·基于GA-SVM的文本分类系统实现第38-41页
     ·算法实现过程第38-39页
     ·实验结果及分析第39-41页
   ·本章小结第41-42页
第四章 信息采集——爬行器的设计第42-52页
   ·爬行器搜索策略分析第42-44页
     ·常用的搜索策略第42-43页
     ·垂直搜索策略第43-44页
   ·Fish算法及其改进第44-46页
   ·基于改进Fish算法的爬行器设计第46-47页
   ·风险Crawler实现关键技术第47-51页
     ·基于Strategy模式的爬行策略模块设计第47-48页
     ·Java多线程第48-51页
   ·本章小结第51-52页
第五章 信息索引——索引数据库设计第52-62页
   ·信息索引机制第52-54页
     ·基于分词的信息索引第52-53页
     ·基于单汉字的信息索引第53-54页
   ·信息索引模型第54-55页
   ·基于单汉字和倒排索引的风险索引实现第55-56页
   ·索引数据库查询第56页
   ·风险索引数据库建设关键技术第56-61页
     ·数据库连接池技术第56-59页
     ·关系数据库全文索引技术第59-61页
   ·本章小结第61-62页
第六章 综合风险垂直搜索引擎的系统设计与实现第62-66页
   ·系统总体框架设计第62页
   ·系统功能及运行第62-64页
   ·开发与运行环境第64-65页
     ·开发环境第64页
     ·运行环境第64-65页
   ·本章小结第65-66页
第七章 结论与展望第66-68页
   ·本文工作总结第66页
   ·前景展望第66-68页
参考文献第68-72页
致谢第72-73页
硕士期间发表论文及参加项目第73页

论文共73页,点击 下载论文
上一篇:活性三肽法氏囊素的液相合成研究
下一篇:我国退耕还林(草)生态补偿研究--以陕西省吴起县为例