阅读新闻

内蒙古民族文化数据库平台建成运行 蒙古语言语语料库上线

    [日期:2016-01-25]

  1月20日上午,内蒙古社会科学院在内蒙古维力斯酒店举行内蒙古民族文化数据库平台建成运行暨蒙古语言语语料库展示系统开通仪式。自治区党委常委、宣传部部长乌兰,自治区人大常委会副主任吴团英出席开通仪式并点击开通数据库平台运行和蒙古语言语语料库展示系统上线。

  “内蒙古民族文化数据库”是“内蒙古民族文化建设研究工程”重大项目之一,是为充分利用现代数字化技术手段,最大限度地保护研究和开发利用民族文化资源,全面整合和系统展示“内蒙古民族文化建设研究工程”及自治区近年来一系列民族文化建设成果的大型综合性文化资源数据库。该数据库包括文献档案库、内蒙古文化资源库、内蒙古民族民间文化遗产库、内蒙古蒙古族人才库等10个子库,此次所展示的“蒙古语言语语料库”是首批入驻并上线运行的子库之一,其他9个子库将分别建设,陆续入驻、上线运行。

  据悉,“内蒙古民族文化数据库”建设项目自2014年实施以来,完成数据加工标准体系和搭建数据库支撑平台系统两个阶段性研制工作。主要包括民族文化数据库14个标准规范体系建设、全媒体多语种资源应用支撑软件平台建设、民族文化数据库应用软件开发、数据库移动终端发布系统开发、十大数据库统一检索平台开发、统一身份认证平台开发等内容。该支撑平台系统涉及多个系统和多项技术,设计总容量64TB,支持各种主流操作系统(包括国产操作系统)、主流开发平台和较多类型的应用服务器,预留与其他系统的接口,能够方便与现有应用系统的整合集成,充分体现先进性、集成性、开放性、易用性、扩展性、稳定性、时效性和安全性并重的建设原则。

  “蒙古语言语语料库”是我区于2005年启动的“蒙古语语料库”建设工程重要成果之一。目前共完成我国8省区、蒙古国5省市、俄罗斯2个共和国境内97个采集点搜集6725人、4192个小时自然口语语料和4000多小时书面语语料的收集工作,建成8000小时语料或8000万词“言语语料库”,其成果质量达到国内外先进水平。这次向社会展示发布的是200个小时自然口语精选语料中的100个小时的未标注语料和50个小时经过国际音标标注和传统蒙古文转写的原始语料部分。

  目前,基于云计算和大数据的我区第一个大型综合性文化资源服务系统——内蒙古民族文化数据库建成并投入运行,将为内蒙古民族文化强区建设和我区全面建成小康社会提供强有力的文化支撑和信息服务。

 

来源:内蒙古社会科学院

  • 阅读次数