首页--经济论文--财政、金融论文--金融、银行论文--中国金融、银行论文--金融市场论文

基于股吧文本的主题挖掘及其股票投资应用

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-17页
    1.1 本文的研究背景与意义第10-11页
    1.2 国内外研究综述第11-14页
        1.2.1 基于社交媒体的主题挖掘研究综述第11-13页
        1.2.2 基于主题投资的选股策略研究综述第13-14页
    1.3 本文创新点与章节安排第14-16页
    1.4 本章小结第16-17页
第二章 预备知识第17-38页
    2.1 获取文本的相关技术第17-22页
        2.1.1 网络爬虫简介第17-18页
        2.1.2 Python爬虫第18-22页
    2.2 文本预处理的相关方法第22-24页
        2.2.1 汉字简繁体转换第23页
        2.2.2 中文分词第23-24页
        2.2.3 过滤停用词第24页
        2.2.4 特征提取第24页
    2.3 主题挖掘的相关理论第24-37页
        2.3.1 主题挖掘第24-26页
        2.3.2 LDA基础第26-29页
        2.3.3 LDA简介第29-37页
    2.4 本章小结第37-38页
第三章 基于股吧文本的主题挖掘第38-47页
    3.1 数据获取第38-39页
        3.1.1 数据来源第38页
        3.1.2 数据爬取第38-39页
        3.1.3 数据保存第39页
    3.2 数据清洗第39-41页
        3.2.1 汉字简繁体转换第39-40页
        3.2.2 分词、过滤停用词第40-41页
    3.3 主题挖掘第41-46页
        3.3.1 LDA算法第41-44页
        3.3.2 文本聚类算法第44-46页
        3.3.3 算法比较第46页
    3.4 本章小结第46-47页
第四章 基于主题挖掘的股票投资应用第47-67页
    4.1 多因子选股策略的相关理论第47-51页
        4.1.1 CAPM模型第47-48页
        4.1.2 APT模型第48页
        4.1.3 Fama-Freach三因子模型第48-49页
        4.1.4 多因子策略评价指标第49-51页
    4.2 构建主题热度因子第51-56页
        4.2.1 构建主题热度因子第51-54页
        4.2.2 主题热度因子有效性检验第54-56页
    4.3 多因子选股策略构建第56-66页
        4.3.1 构建多因子库第56-57页
        4.3.2 建立逻辑回归选股模型第57-60页
        4.3.3 配资和止损第60页
        4.3.4 策略构建第60-64页
        4.3.5 添加主题热度因子前后策略效果对比第64-66页
    4.4 本章小结第66-67页
结论第67-69页
参考文献第69-73页
攻读硕士学位期间取得的研究成果第73-74页
致谢第74-75页
附录第75-77页
附件第77页

论文共77页,点击 下载论文
上一篇:风险投资对新三板挂牌企业经营水平影响分析
下一篇:机构投资者持股比例对上市公司会计信息质量的影响研究