摘要 | 第4-6页 |
Abstract | 第6-7页 |
1 绪论 | 第10-16页 |
1.1 研究背景和意义 | 第10页 |
1.2 国内外研究现状 | 第10-14页 |
1.2.1 随机森林模型国内外研究 | 第10-12页 |
1.2.2 RNN、LSTM神经网络模型国内外研究现状 | 第12-14页 |
1.3 本文主要研究内容 | 第14页 |
1.4 本文的组织结构 | 第14-15页 |
1.5 创新点 | 第15页 |
1.6 技术路线图 | 第15-16页 |
2 裁判书爬取和信息提取 | 第16-29页 |
2.1 问题提出 | 第16页 |
2.2 裁判文书网网页爬取策略 | 第16-19页 |
2.3 裁判书具体爬取过程 | 第19-23页 |
2.4 裁判文书的信息提取 | 第23页 |
2.5 python中的正则表达式介绍 | 第23-28页 |
2.5.1 正则表达式 | 第23-24页 |
2.5.2 python中的正则表达式的功能和基本语法 | 第24-28页 |
2.6 本章小结 | 第28-29页 |
3 被告人的人物画像 | 第29-39页 |
3.1 判刑为无期徒刑的被告者基本信息的描述性分析 | 第29-33页 |
3.2 判刑为有期徒刑的被告者基本信息的描述性分析 | 第33-37页 |
3.3 本章小结 | 第37-39页 |
4 随机森林分析 | 第39-57页 |
4.1 随机森林模型相关理论 | 第39-43页 |
4.1.1 CART决策树处理回归问题 | 第39-41页 |
4.1.2 CART决策树处理分类问题 | 第41-42页 |
4.1.3 随机森林算法 | 第42页 |
4.1.4 本文采用随机森林模型的原因 | 第42-43页 |
4.2 主刑的预测分析 | 第43-51页 |
4.2.1 主刑预测随机森林模型的建立 | 第44-48页 |
4.2.2 主刑预测的十折交叉验证 | 第48-49页 |
4.2.3 各变量的重要程度 | 第49-51页 |
4.3 缓刑的预测分析 | 第51-54页 |
4.3.1 缓刑预测随机森林模型的建立 | 第51-52页 |
4.3.2 缓刑预测的十折交叉验证 | 第52-54页 |
4.3.3 各变量对缓刑的影响程度 | 第54页 |
4.4 判刑年限的回归预测分析 | 第54-56页 |
4.4.1 用随机森林模型进行预测 | 第54-55页 |
4.4.2 各变量对判刑时间长度的影响程度 | 第55-56页 |
4.5 本章小结 | 第56-57页 |
5 RNN和 LSTM循环神经网络自动生成法律判决书 | 第57-73页 |
5.1 RNN(循环神经网络)和LSTM(长短期记忆神经网络)理论 | 第57-65页 |
5.1.1 传统循环神经网络RNN | 第57-60页 |
5.1.2 LSTM神经网络 | 第60-65页 |
5.2 故意伤害罪裁判文书的自动生成 | 第65-72页 |
5.3 本章小结 | 第72-73页 |
6 结论与展望 | 第73-75页 |
6.1 结论 | 第73-74页 |
6.2 展望 | 第74-75页 |
参考文献 | 第75-78页 |
后记 | 第78-79页 |
攻读学位期间取得的科研成果清单 | 第79页 |