首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于论坛关键字搜索的改进TF-IDF算法及其应用

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-12页
    1.1 研究背景和意义第8-9页
    1.2 国内外研究现状第9-10页
    1.3 主要研究内容第10页
    1.4 本文的组织结构第10-12页
第2章 相关理论知识第12-20页
    2.1 引言第12页
    2.2 关键词提取方法第12-13页
        2.2.1 基于自然语言分析的方法第12-13页
        2.2.2 基于统计的方法第13页
        2.2.3 基于词语共现图的方法第13页
        2.2.4 基于词语网络的方法第13页
    2.3 文本挖掘与文本聚类第13-15页
        2.3.1 文本挖掘第13-14页
        2.3.2 文本聚类第14-15页
    2.4 中文词汇特点第15-16页
    2.5 论坛特性第16页
    2.6 论坛帖子结构特征第16-17页
    2.7 中文分词第17页
    2.8 网络爬虫第17-20页
第3章 基于论坛的TF-IDF算法的改进第20-26页
    3.1 TF-IDF算法第20-21页
        3.1.1 TF值计算第20页
        3.1.2 IDF计算第20-21页
    3.2 TF-IDF算法在基于论坛的关键词提取中的不足第21-22页
    3.3 TF-IDF算法的改进第22-23页
    3.4 改进后的TF-IDF算法的测试第23-26页
第4章 系统分析与设计第26-40页
    4.1 系统概况第26-27页
    4.2 需求分析第27页
    4.3 系统设计目标与原则第27-28页
    4.4 系统结构第28页
    4.5 系统功能第28-29页
    4.6 系统总体流程第29-30页
    4.7 数据库设计第30页
    4.8 模块设计第30-40页
        4.8.1 网络爬虫的设计第30-32页
        4.8.2 文本分词第32-33页
        4.8.3 关键词提取第33-37页
        4.8.4 文本向量空间模型的建立与帖子文本分类第37-39页
        4.8.5 关键字匹配和网页排序第39-40页
第五章 系统实现与测试第40-47页
    5.1 系统环境第40-41页
        5.1.1 软硬件环境第40页
        5.1.2 MyEclipse配置第40-41页
        5.1.3 SQL Server的安装第41页
    5.2 系统界面第41-44页
        5.2.1 系统后台界面第41-43页
        5.2.2 系统主界面第43-44页
    5.3 系统测试第44-45页
    5.4 系统性能分析第45-47页
        5.4.1 评价标准第45页
        5.4.2 性能分析第45-47页
第6章 总结与展望第47-49页
    6.1 总结第47页
    6.2 展望第47-49页
参考文献第49-52页
致谢第52-53页
在读期间公开发表论文(著)及科研情况第53页

论文共53页,点击 下载论文
上一篇:统一身份认证平台的研究与实现
下一篇:协同中继网络的高能效安全中继选择方案