首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于LBS的新闻索引算法的研究与应用

摘要第1-6页
Abstract第6-12页
第1章 绪论第12-16页
   ·课题背景及意义第12-13页
     ·课题背景第12-13页
     ·问题的提出第13页
     ·研究目的和意义第13页
   ·主要研究内容和组织结构第13-16页
     ·主要研究内容第13-14页
     ·组织结构第14-16页
第2章 相关理论与技术第16-26页
   ·Web标准与协议第16-18页
     ·HTML第16-17页
     ·ICMP第17页
     ·MIME Type第17-18页
     ·HTTP Referer第18页
   ·搜索引擎相关内容第18-21页
     ·信息检索的定义第18页
     ·搜索引擎的分类第18-19页
     ·网络搜索引擎的架构第19-21页
     ·面向主题的信息采集第21页
   ·网络爬虫的相关内容第21-22页
     ·网络爬虫的概念第21页
     ·网络爬虫的基本结构第21-22页
   ·LBS相关内容第22-24页
     ·基于地理位置服务的定义第22页
     ·基于地理位置服务的基本组成第22-23页
     ·谷歌地址解析服务第23-24页
   ·本章小结第24-26页
第3章 信息索引算法的研究第26-52页
   ·文本采集第26-30页
     ·信息源第26页
     ·网页遍历第26-28页
     ·URL去重第28-30页
   ·正文提取第30-37页
     ·元数据第30-31页
     ·文档对象模型第31-32页
     ·基于字数统计的正文提取第32-34页
     ·基于超链接分析的正文提取第34-36页
     ·其他正文提取方法第36-37页
   ·中文分词第37-39页
     ·基于字符串匹配的算法第37-38页
     ·基于理解的算法第38页
     ·基于统计的算法第38-39页
     ·分词算法的比较第39页
   ·相似度判断第39-43页
     ·词频统计第40页
     ·相似度计算第40-41页
     ·Simhash算法第41-43页
   ·网页排序第43-47页
     ·HITS算法研究第43-45页
     ·PageRank算法研究第45-46页
     ·HITS算法与PageRank算法的比较第46-47页
   ·建立倒排索引第47-51页
     ·倒排索引的概念第47-48页
     ·两次文档遍历法第48-49页
     ·基于排序的倒排方法第49-50页
     ·基于归并的倒排方法第50-51页
   ·本章小结第51-52页
第4章 新闻索引算法的设计第52-76页
   ·文本采集算法第52-57页
     ·聚焦采集算法第52-54页
     ·元数据提取算法第54-55页
     ·URL去重第55-56页
     ·爬虫礼貌策略第56-57页
   ·正文提取算法第57-60页
     ·网页预处理第57-58页
     ·正文提取算法第58-60页
   ·LBS解析算法第60-66页
     ·建立地名词典第61页
     ·地址抽取算法第61-63页
     ·地址解析与定位算法第63-66页
   ·文本信息处理第66-69页
     ·中科院分词系统第66-67页
     ·关键词提取第67-69页
     ·重复文本过滤第69页
   ·网页排序算法第69-72页
     ·地理位置关键词第70页
     ·HITS算法的改进第70-71页
     ·排序权值计算第71-72页
   ·倒排索引第72-74页
     ·Redis系统第73-74页
     ·建立倒排索引第74页
   ·本章小结第74-76页
第5章 算法在实际中的应用第76-90页
   ·基于地理位置的新闻服务设计第76-86页
     ·新闻模块整体设计第77-78页
     ·新闻采集模块设计第78-79页
     ·地理位置解析模块设计第79-80页
     ·网页解析模块设计第80-81页
     ·新闻索引建立设计第81页
     ·核心数据结构设计第81-85页
     ·呈现策略设计第85-86页
   ·实验环境与数据来源第86页
     ·实验环境第86页
     ·数据来源第86页
   ·实验结果分析第86-89页
     ·网页采集性能第87页
     ·网页解析性能第87页
     ·索引建立性能第87页
     ·新闻定位性能第87页
     ·用户响应性能第87-89页
     ·整体性能第89页
   ·本章小结第89-90页
第6章 结论与展望第90-92页
参考文献第92-96页
致谢第96-98页
攻读学位期间发表的论文第98页

论文共98页,点击 下载论文
上一篇:车载信息系统服务中心子系统的设计与实现
下一篇:房屋中介管理系统的设计与实现