上古汉语标记语料库

5个月前发布 36 00

「中央研究院上古漢語標記語料庫」是「中央研究院古漢語語料庫」(Academia Sinica Ancient Chinese Corpus)的一個次語料庫。「中央研究院古漢語語料庫」是應漢語史研究需求而建構的語料庫。這個語料庫又可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及有標注的標記語料庫。目前素語料庫所蒐集的語料已含蓋上...

收录时间:
2025-07-29
上古汉语标记语料库上古汉语标记语料库
📝字数:588字
⏱️阅读:2分钟
🗓️发布:2025 年 07 月 29 日 19:42
🔄更新:2025 年 07 月 29 日 19:42
📁分类:未分类
📌编号:DLCN-20250729-1

「中央研究院上古漢語標記語料庫」是「中央研究院古漢語語料庫」(Academia Sinica Ancient Chinese Corpus)的一個次語料庫。「中央研究院古漢語語料庫」是應漢語史研究需求而建構的語料庫。這個語料庫又可依是否經過斷詞及加標詞類而分成兩類,即未加標的素語料庫以及有標注的標記語料庫。目前素語料庫所蒐集的語料已含蓋上古漢語(先秦至西漢)、中古漢語(東漢魏晉南北朝)、近代漢語(唐五代以後)大部分的重要語料,並已陸續開放使用;在標記語料庫方面,上古漢語及近代漢語都已有部分語料完成標注的工作,並視結果逐步提供線上檢索。 「中央研究院古漢語語料庫」的建構始於一九九0年,創始者為黃居仁(語言所研究員)、譚樸森(英國倫敦大學亞非學院教授)、陳克健(資訊所研究員)、魏培泉(語言所研究員)等,最初的經費來源為蔣經國基金會及中央研究院歷史語言研究所,目標是蒐集上古漢語的素語料。素語料庫的構建自此未曾停歇,語料也由上古漢語擴充到中古漢語和近代漢語。 這個蒐集工作的持續基本上是由魏培泉負責執行,經費來源主要為中央研究院。上古漢語語料的標注自一九九五年開始進行,近代漢語的標注也從一九九七年開始規劃,隨後即付諸實行,主其事者為魏培泉與劉承慧 (清華大學中文系教授)。支持這個標注工作的經費主要來自中央研究院及國科會,在標注及搜檢的技術方面則有黃居仁、陳克健及本院計算中心的協助。

📄 版权声明

  1. 本平台所有原创内容(含文字、配图、排版设计等),均依据 知识共享署名 - 非商业性使用 4.0 国际许可协议(CC BY-NC 4.0) 对外授权,任何使用主体需严格遵守协议约定。
  2. 本平台转载文章的版权归原作者或原版权方所有,文中观点不代表本平台立场。本平台对文章内容的准确性、可靠性、完整性不作任何明示或暗示的保证,仅供读者参考,相关责任由读者自行承担。
  3. 转载仅为传递行业资讯、实用知识等有益信息,不以盈利为目的。若涉及侵权,本平台在收到权利人有效通知后,将立即删除文章并配合处理,不承担额外法律责任。

相关导航

没有相关内容!

暂无评论

none
暂无评论...