首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向专业领域的网络信息采集及主题检测技术研究与应用

摘要第1-5页
Abstract第5-13页
第1章 绪论第13-38页
   ·课题背景及意义第13-16页
   ·国内外研究现状第16-32页
     ·信息采集技术研究现状第16-22页
     ·文本聚类算法研究现状第22-24页
     ·主题模型研究现状第24-29页
     ·主题检测发展过程第29-32页
   ·本文研究内容第32-36页
   ·内容与结构安排第36-38页
第2章 领域信息采集第38-52页
   ·引言第38-39页
   ·已有增量更新策略存在的问题第39-44页
     ·网页选择算法第39-43页
     ·网站选择算法第43-44页
   ·领域信息增量自适应更新策略第44-48页
     ·模型建立及优化第44-46页
     ·种子站点选择方法第46-47页
     ·自适应增量更新策略第47-48页
   ·实验结果与分析第48-49页
     ·自适应增量更新策略有效性第48页
     ·领域信息分布式采集第48-49页
   ·本章小结第49-52页
第3章 网络主题检测方法第52-77页
   ·引言第52-53页
   ·面向专业领域的在线主题检测方法第53-60页
     ·主题特征提取和特征空间降维第53-55页
     ·特征词距离度量第55-57页
     ·基于NTD 距离的聚类过程第57-58页
     ·实验及结果分析第58-60页
   ·在线新事件检测方法第60-66页
     ·增量TF-IDF 模型第61-62页
     ·特征词权重第62页
     ·基于时间线分析的新事件检测方法第62-64页
     ·实验结果和分析第64-66页
   ·基于混合概率模型主题聚类方法第66-75页
     ·一种简单的混合主题模型第68页
     ·基于主题采样的EM 近似迭代方法第68-70页
     ·实验结果第70-75页
   ·本章小结第75-77页
第4章 领域信息自适应主题检测及新闻推荐方法第77-96页
   ·引言第77-78页
   ·主题模型简介第78-80页
     ·模型的假设第79-80页
     ·LDA 模型第80页
   ·主题模型的选择第80-88页
     ·主题模型选择方法第80-82页
     ·基于主题模型的主题距离第82-83页
     ·实验结果第83-86页
     ·结果分析第86-88页
   ·自适应主题检测和新闻推荐算法第88-93页
     ·自适应主题检测算法第88-90页
     ·实验结果第90-93页
     ·自适应主题新闻推荐第93页
   ·本章小结第93-96页
第5章 领域信息采集及主题检测技术应用第96-121页
   ·引言第96页
   ·非阻塞结构的单机爬虫第96-100页
     ·Inar 体系结构第96-97页
     ·网页抓取实验第97-99页
     ·实验结果分析第99-100页
   ·分布式信息采集技术的应用第100-114页
     ·分布式并行爬虫结构设计第100-103页
     ·负载均衡机制第103-104页
     ·分布式并行采集实验第104-114页
   ·金融信息主题检测和新闻推荐系统第114-119页
     ·系统信息采集和处理情况第115-116页
     ·金融新闻推荐系统运行情况第116-119页
   ·本章小结第119-121页
结论第121-124页
参考文献第124-137页
攻读博士学位期间发表的学术论文及其它成果第137-140页
致谢第140-142页
个人简历第142页

论文共142页,点击 下载论文
上一篇:僵尸网络对抗技术研究
下一篇:骨干网流监测关键技术研究