社会网络中关联用户的挖掘与分析
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 1 绪论 | 第10-14页 |
| ·研究背景 | 第10-11页 |
| ·社会网络 | 第10-11页 |
| ·社会网络搜索引擎 | 第11页 |
| ·国内外研究现状 | 第11-12页 |
| ·本文主要工作及研究意义 | 第12页 |
| ·本文组织结构 | 第12-14页 |
| 2 相关算法及技术基础 | 第14-22页 |
| ·TFIDF 算法 | 第14-15页 |
| ·共现算法 | 第15页 |
| ·搜索引擎技术 | 第15-18页 |
| ·网络爬虫 | 第16-17页 |
| ·网页去噪 | 第17-18页 |
| ·中文分词技术 | 第18页 |
| ·网络编程 | 第18-21页 |
| ·SOCKET 编程 | 第18-20页 |
| ·SilverLight | 第20-21页 |
| ·本章小结 | 第21-22页 |
| 3 需求分析与总体设计 | 第22-28页 |
| ·需求分析 | 第22-23页 |
| ·设计目标 | 第22页 |
| ·功能分析与设计 | 第22-23页 |
| ·总体设计 | 第23-27页 |
| ·网络爬虫的设计 | 第24-26页 |
| ·数据分析器的设计 | 第26页 |
| ·搜索平台的设计 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 4 算法分析与设计 | 第28-39页 |
| ·数据采集相关算法设计 | 第28-33页 |
| ·合法URL 判断 | 第29-30页 |
| ·规则URL 判断 | 第30-31页 |
| ·避免重复抓取策略 | 第31-32页 |
| ·文件存储结构 | 第32-33页 |
| ·关联用户挖掘 | 第33-35页 |
| ·用户提取 | 第34页 |
| ·关联用户的定义及其提取 | 第34-35页 |
| ·关联关键字提取 | 第35-36页 |
| ·分词 | 第36页 |
| ·计算词语权重 | 第36页 |
| ·关联用户搜索 | 第36-37页 |
| ·数据库的设计 | 第37-38页 |
| ·本章小结 | 第38-39页 |
| 5 详细设计与具体实现 | 第39-60页 |
| ·网络爬虫的实现 | 第39-48页 |
| ·crawler 模块的实现 | 第40-42页 |
| ·storage 模块的实现 | 第42-44页 |
| ·url_parser 模块的实现 | 第44-45页 |
| ·url_ server 模块的实现 | 第45-47页 |
| ·url_ injector 模块的实现 | 第47页 |
| ·lib 模块 | 第47-48页 |
| ·数据分析器的实现 | 第48-53页 |
| ·提取用户 | 第48-51页 |
| ·用户关系的提取 | 第51页 |
| ·关键字的提取 | 第51-53页 |
| ·用户关系的搜索与可视化 | 第53-57页 |
| ·Application 层的实现 | 第53-56页 |
| ·View 层的实现 | 第56页 |
| ·Web 层的实现 | 第56-57页 |
| ·数据库设计与实现 | 第57-59页 |
| ·本章小结 | 第59-60页 |
| 6 系统测试与分析 | 第60-63页 |
| ·系统测试 | 第60-62页 |
| ·结果分析 | 第62-63页 |
| 7 总结与展望 | 第63-65页 |
| 参考文献 | 第65-67页 |
| 致谢 | 第67-68页 |
| 个人简历 | 第68页 |
| 发表的学术论文 | 第68页 |