漢簡語料庫的設計與應用
摘要 | 第1-7页 |
ABSTRACT | 第7-11页 |
第一章 緒論 | 第11-25页 |
第一節 選题依據和研究意義 | 第11-15页 |
一、 選題依據 | 第11-13页 |
二、 研究意義 | 第13-15页 |
第二節 相關研究現狀綜述 | 第15-23页 |
一、 漢簡語料庫建設與應用現狀 | 第15-23页 |
二、 現狀分析與改善目標 | 第23页 |
第三節 研究方法和創新點 | 第23-25页 |
一、 研究方法 | 第23-24页 |
二、 創新點 | 第24-25页 |
第二章 漢簡語料庫系統設計 | 第25-55页 |
第一節 漢簡語料庫的數據庫設計與建立 | 第25-43页 |
一、 漢簡語料庫收錄材料範圍 | 第26-35页 |
二、 數據庫中字、詞、簡、篇的關聯方法設計 | 第35-38页 |
三、 自動分詞方法探析 | 第38-40页 |
四、 各家考釋的數據庫表示方法 | 第40-41页 |
五、 數據庫打印功能 | 第41-43页 |
第二節 漢簡語料庫網絡平台 | 第43-55页 |
一、 平台簡介 | 第43-44页 |
二、 全文檢索功能 | 第44-49页 |
三、 考釋檢索 | 第49-51页 |
四、 詞性檢索功能 | 第51-52页 |
五、 著錄顯示功能 | 第52-53页 |
六、 簡牘拓片顯示功能 | 第53页 |
七、 编連綴合考釋信息顯示功能 | 第53-55页 |
第三章 基於漠簡語料庫的詞彙自動化標註研究 | 第55-86页 |
第一節 研究材料概說 | 第56-60页 |
一、 西北漢簡 | 第56-58页 |
二、 古書類漢簡 | 第58-59页 |
三、 材料版本選擇 | 第59-60页 |
第二節 語料預處理與詞典製作 | 第60-65页 |
一、 語料預處理 | 第60-63页 |
二、 詞典製作 | 第63-65页 |
第三節 自動化分詞與詞性標註 | 第65-74页 |
一、 分詞算法介紹 | 第66-70页 |
二、 詞性自動化標註方法 | 第70-71页 |
三、 實驗過程 | 第71-74页 |
第四節 標註結果分析及改進方法 | 第74-86页 |
一、 標註結果分析 | 第74-85页 |
二、 改進方法 | 第85-86页 |
第四章 結語 | 第86-88页 |
參考文獻 | 第88-92页 |
附錄 | 第92-100页 |
附表一 西北漢簡人名表 | 第92-95页 |
附表二 西北漢簡姓氏頻次表 | 第95-97页 |
附表三 西北漢簡地名表 | 第97-99页 |
附表四 西北漢簡職官表 | 第99-100页 |
後記 | 第100页 |