22日,記者從內(nèi)蒙古自治區(qū)社會科學(xué)院證實,歷經(jīng)10年,由中國內(nèi)蒙古自治區(qū)政府啟動的蒙古語語料庫建設(shè)工程一期工程已完成,已建成8000萬詞級蒙古言語語料庫,并上線運行。
蒙古語語料庫建設(shè)工程于2005年啟動,在實施的10年間,課題組在使用蒙古語的中國8個省區(qū)、蒙古國的5個省市、俄羅斯布里亞特共和國和卡爾梅克共和國境內(nèi)的97個采集點,搜集了6725人共4192小時的自然口語語料和4000多小時的書面語料,建成8000萬詞級蒙古言語語料庫。
蒙古語語料庫建設(shè)工程首席專家巴特爾介紹,蒙古語語料庫建設(shè)工程計劃用20年建成中國首個2億詞級的蒙古語、達斡爾語、鄂溫克語、鄂倫春語大型綜合性語料庫。工程分2期進行,目前,一期工程已完成,二期工程開始實施。
巴特爾認為,蒙古語語料庫建設(shè)工程將為搶救瀕危民族語言、保護弱勢語言、保存開發(fā)利用蒙古語等少數(shù)民族語言資源提供基礎(chǔ),并為蒙古語等少數(shù)民族語言文字的規(guī)范化、信息化提供一個理想的信息資源。
記者 李愛平
文章來源:中國新聞網(wǎng) 責(zé)任編輯:劉姍
已有0人發(fā)表了評論