首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

行业网站分类方法研究与应用

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-10页
   ·引言第7页
   ·研究背景第7-8页
     ·Web挖掘和链接分析第7-8页
     ·Web Community相关研究第8页
   ·本文的工作和组织结构第8-10页
第二章 相关研究综述第10-19页
   ·数据挖掘第10-11页
     ·数据挖掘定义第10页
     ·WEB挖掘第10-11页
   ·WEB COMMUNITY的定义第11-12页
     ·Web Community的泛化定义第11-12页
     ·基于图论的定义第12页
   ·现有WEB COMMUNITY识别技术第12-18页
     ·基于链接的分析算法第12-17页
       ·PageRank算法第13-14页
       ·HITS算法第14-16页
       ·PageRank算法和HITS算法的进一步探讨第16-17页
     ·Maximum Flow Communities第17-18页
       ·最大流&最小割第17页
       ·基于最大流&最小割的web community识别算法第17-18页
     ·基于网页内容的主题判别第18页
   ·本章小结第18-19页
第三章 网站主题计算第19-37页
   ·网站主题确定在行业网站分类中的意义第19-20页
   ·最能代表网站主题网页的确定算法第20-35页
     ·通过简约网站拓扑结构获取最能代表网站主题网页算法第20-25页
     ·通过计算链接度来获取最能代表网站主题网页算法第25-27页
     ·两种算法的比较第27-35页
   ·网站主题确定算法第35-36页
   ·本章小结第36-37页
第四章 关键词模型第37-44页
   ·建立“种子”关键词库第37-38页
   ·适合采用的关键词模型第38-41页
     ·布尔模型第38页
     ·向量空间模型第38-39页
     ·概率模型第39-41页
   ·关键词依赖性概念第41-42页
   ·关键词权重的设定第42-43页
     ·出现频率和权重的关系第42-43页
   ·本章小结第43-44页
第五章 专业网站有用链接分布特点及链接相关度分析第44-53页
   ·专业网站有用链接分布情况第44-50页
     ·实验数据分析第47-50页
   ·链接相关度分析第50-52页
     ·基于链接所处位置的链接相关度分析第50-51页
     ·基于链接指向目标的相关度分析第51页
     ·基于链接标签信息的链接相关度计算第51-52页
     ·链接相关度的构建第52页
   ·本章小节第52-53页
第六章 系统的设计与实现第53-64页
   ·系统设计目标第53-54页
   ·系统架构第54-55页
     ·专业网络爬虫第54-55页
     ·网站、页面逻辑处理模块第55页
     ·行业网站分类构建模块第55页
   ·系统实现描述第55-59页
   ·系统测试分析第59-64页
     ·分析过程第59-60页
     ·相关统计数据第60-61页
     ·数据特征分析第61-62页
     ·系统运行结果对比第62-64页
第七章 总结与展望第64-66页
   ·总结第64页
   ·展望第64-66页
参考文献第66-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:独山子石化公司炼油厂生产战略研究
下一篇:基于CRM系统的广元市商业银行信用风险管理研究