首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于文本挖掘的性别分类研究

摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-16页
   ·选题背景、研究目的和意义第9-11页
     ·选题背景第9-10页
     ·研究目的和意义第10-11页
   ·国内外研究现状第11-14页
     ·国内研究现状第11-12页
     ·国外研究现状第12-14页
   ·本文研究的主要内容第14-16页
第2章 互联网用户性别分类的理论基础第16-35页
   ·互联网的用户性别差异第16-19页
     ·网络使用意图第16-17页
     ·网络环境下的语言运用差异第17-19页
   ·文本分类第19-28页
     ·分词第20-21页
     ·词性标注及词汇处理第21-22页
     ·文本特征模型第22-23页
     ·特征提取第23-26页
     ·分类算法第26页
     ·评价指标第26-28页
   ·基于机器学习的分类算法第28-30页
     ·支持向量机第28-29页
     ·朴素贝叶斯第29-30页
     ·N-gram 算法第30页
   ·基于统计学的文本分类方法第30-32页
     ·罗杰斯特回归的基本原理第30-31页
     ·罗杰斯特回归过程第31-32页
   ·Apriori 算法基本原理第32-34页
     ·关联规则介绍第32-33页
     ·Apriori 算法第33-34页
   ·本章小结第34-35页
第3章 用户发帖行为及性别分类研究第35-47页
   ·数据收集及预处理第35-36页
     ·数据来源及数据筛选第35-36页
   ·发帖行为研究第36-40页
     ·理论基础及基本假设第36-37页
     ·统计方法第37-38页
     ·结果分析第38-40页
   ·性别分类研究第40-46页
     ·数据处理第41-42页
     ·特征提取第42页
     ·分类结果分析第42-46页
       ·汽车论坛数据分类第42-44页
       ·股票论坛数据分类第44-46页
   ·本章小结第46-47页
第4章 不同性别用户的产品属性词提取第47-55页
   ·基于Apriori 算法提取特征词第47-49页
     ·建立关联规则的事务文件第47-48页
     ·提取频繁项集第48页
     ·特征剪枝方法第48-49页
   ·不同性别用户的汽车属性词提取第49-52页
     ·产品属性词提取第49-50页
     ·产品属性关联规则提取第50-52页
   ·不同性别用户的股票属性词提取第52-54页
     ·股票属性词提取第52-53页
     ·股票属性关联规则提取第53-54页
   ·本章小结第54-55页
第5章 性别词典的构建第55-63页
   ·词语相似度以及计算方法第55-57页
     ·词语相似度第55-56页
     ·词语相似度计算第56-57页
   ·性别词典的构建第57-62页
     ·性别基础词库的构建第57-59页
     ·计算词语相似度并构建性别词典第59-62页
   ·本章小结第62-63页
结论第63-65页
参考文献第65-68页
攻读硕士学位期间发表的论文及其它成果第68-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:均匀向心型管束参数化设计及流场分析接口软件开发
下一篇:电子商务推荐系统用户采纳影响因素研究