6月30日,由中国公共关系协会文化大数据产业委员会主办的国家文化大数据标识基地建设论坛在重庆永川举行。在主旨演讲环节,中国数字文化集团大数据中心主任蒋鉴发表题为《国家文化大数据标识基地建设》的主旨演讲。以下是演讲全文。
各位领导,各位老师,大家下午好!
下面我就中国数字文化集团这些年关于数字化与数据化的工作给大家做一个分享,希望未来各个文化单位、文化机构都能够参与国家文化大数据标识基地的建设。
党的二十大报告明确提出要“实施国家文化数字化战略”。根据两办《意见》,建设国家文化大数据体系既是新时代文化建设的重大基础性工程,也是打通文化事业和文化产业、畅通文化生产和文化消费、融通文化和科技的重要举措。
《意见》特别强调了标识的重要性,在重点任务“关联形成中华文化数据库”中明确:统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,全面梳理中华文化资源,推动文化资源科学分类和规范标识;在保障措施“建立文化数字化标准体系”中明确:加强标识解析体系建设,推广信息与文献相关国际标准。
作为文化和旅游部首家国家级高新技术企业,中数集团积极响应充分发挥自有资源优势,有效利用在国家文化大数据体系中建设标本库、基因库、素材库方向的丰富经验和对视频、音频、图像、文本等多项数据作分类、整理、拆分、标识、关联等方面的实践成果,进一步推动国家文化大数据标识基地建设。经过三年的探索实践和创新奋斗,取得了一系列成果。集团将按国家文化大数据标识基地建设的要求进行积极探索,为扩大试点工作成效积累经验,发挥示范引领作用。
根据两办《意见》,深化供给侧结构性改革,推动文化存量资源转化为生产要素,是加快发展新型文化企业、文化业态、文化消费模式的重要指导原则。如何统筹利用文化领域已建或在建数字化工程和数据库所形成的成果,全面梳理中华文化资源,也就成为参与国家文化大数据体系建设各家机构的首要任务。
中数集团一方面立足于现有资源,组织开展了文化和旅游部系统各单位文化艺术资源的数字化工作,进行登记、归档、加工整理、保管存储及数据分析。其中,珍贵视音频资料包括:第一、二、三届中国艺术节经典文艺节目;国家舞台艺术精品工程系列节目;徽班进京100周年系列节目;1991-2006年原文化部春节电视联欢晚会节目等。另一方面,中数集团通过承担一系列重要国家文化工程,不断累积自有文化资源。其中,中国京剧“像音像”工程共拍摄任务剧目104部,成片时长超过260小时,录制素材总量超过2000TB;执行《中国连环画数字图书馆》项目,收录经典连环画作品近5000种,并荣获第五届中国出版政府奖等。
在原有文化资源的基础上,集团深入开展对拥有深厚文化资源的地区内文博系统进行数字化采集工作,例如通过使用中数集团自有德国CRUS非接触式超高精度高端扫描仪等行业领先设备,完成了苏州博物馆、苏州丝绸博物馆、苏州戏曲博物馆、苏州吴中区吴文化博物馆的残片类、织物类、服饰类、古籍善本类、瓷器类、漆器类、金银器类等馆藏文物6000余件套的藏品数字化工作,包括文物国际标准身份照片、国际标准环拍视频、高精度三维模型、高精度二维贴图、超高清视频数据、超高清图像数据等多模态数字资源。
基于上述持续扩充的数字内容资源,中数集团专门成立数字资源知识图谱工作组。建设知识图谱体系的基础是做好目录设置、明确数据资源标签的坐标轴、确定资源的主要内容和分类等。
以舞台艺术资源为例,其中一级目录包括编号、文件类型、时间、艺术作品、艺术家、地域、表演工具、版权单位、语言和名称;二级目录包括艺术作品项下的文化与自然遗产、听觉艺术、视觉艺术与手工艺术、书籍与报刊、视听(音像)与交互媒体、设计与服务创意,艺术家线下的表演者、创作者等,共设置有四级目录。
通过数字资源图谱建设工作,整理资源条目过万,系统地梳理了中数集团数字化资源家底,为集团后续开展文化资源数字化标识工作的开展奠定了基础。
中数集团作为国家文化大数据体系建设的承建单位之一,利用自身累积的数字文化资源优势,首批接入国家文化专网,启动国家文化大数据底层关联集成系统装配工作。
底层关联集成系统是国家文化大数据体系实现“物理分散、逻辑集中”的核心部件。该系统基于ISLI国际标准,利用云计算技术、人工智能技术、虚拟现实三维技术等网络技术,专门为文化大数据结构化存储而搭建。其通过国家文化专网连接省域中心,形成文化数据关联网络。
经过底层关联系统解构化的数据,在文化专网里,全流程服务于创作、生产、传播和消费,从而实现文化数据或产品的确权、关联、跟踪、管控、支付和分账。
依托于中数知识图谱建设,中数集团有序开展数字资源分类整理,梳理体系脉络,建立底层逻辑,为进一步开发利用做好铺垫。在知识图谱现有功能的基础上,建设集团知识图谱与底层数据资源的映射关联。
中数集团文化资源大数据底层数据关联建设分为五个环节,依次是资源选择、资源分解、资源识别、资源上传、底层资源关联。集团大数据中心根据各部门、下属单位提供的资源,划分领域及特性,对已上传至国家文化大数据底层关联系统的音频、视频、图像、文字等资源完成在线分类,建设相关的数据集(资源库),将各类资源与数据集进行关联,完成数据集搭建,做好底层资源库搭建工作。
中数集团目前已经建成国家舞台艺术影像库、中国传统音乐数据库、中国大学生优秀动漫作品库、伟大征程艺术档案数据库、世界音乐资源集成数据库、世界乐谱资源集成数据库、世界美术资源集成数据库、非物质文化遗产数据库等8个主数据库;完成中国戏曲影像库、原文化部春节电视联欢晚会资源库、中华民族音乐资源数据库、丝绸之路上的民族音乐赏析数据库、中国戏曲老唱片数据库等69个子库建设。
目前系统内已关联视频6483件、音频25222件、图像129109件,合计文化资源数据16.5万件、文化资源数据集683个。
仅以中国戏曲影像库下设的中国京剧资源库建设为例,目前已建设完成共计约46个数据库,其中二级子库9个,包括行当库、头饰库、戏曲音乐库、流派库、功法库、脸谱库、舞美库、服饰库、剧本库;三级子库26个,包括生库、旦库、净库、丑库、曲牌库等;四级子库11个,包括青衣库、花旦库、老旦库、武旦库等。
按照物理分布、逻辑关联原则,依托信息与文献相关国际标准,中数集团通过对自有地方戏曲剧种、民族民间文艺、古籍、美术等数据资源不断细化拆分,并通过贯通已建或在建文化专题数据库,聚焦社会主义先进文化、革命文化和中华优秀传统文化,提取具有历史传承价值的中华文化元素、符号和标识,以丰富中华民族文化基因的当代表达。
推动国家文化大数据标识基地建设的三年来,通过不断改善数字装备和加强技术研发,中数集团丰富的数字文化资料源源不断地导入国家文化大数据系统,通过数据采集、清理、标注、关联、解构、重构, 完成了数据库前期的搭建和填充工作。
在此基础上,中数集团建设“中数文化大数据综合服务云平台”,利用文化数据服务平台,探索数字化转型升级路径,培育企业高质量发展新动能。中数文化大数据综合服务云平台通过支撑层(国家文化专网各级局域网建设)、数据库(中华文化数据库)、中间层(底层关联引擎即ISLI标识技术系统)、应用层(文化数据供给)和发布层(线上线下全渠道)的系统架构,具有预订预约、文化培训、文化直播、文化商店、志愿者服务、社团等核心功能,面向有文化需求的基层群众,用户可通过手机、电脑多终端便捷获取公共文化服务。
作为中数集团的公共文化管理与服务总平台,中数文化大数据综合服务云平台以数字化推动高质量民生服务的新模式、新业态,不断丰富数字文创、数字内容等相关服务供给,推动公共文化数字化服务的蓬勃发展,全面提高数字化服务的覆盖面、集成度、丰富性、便利性。
为推动国家文化数字化战略,建设国家文化大数据体系,作为国家文化大数据体系建设的承建单位之一,中数集团勇于担当,争做排头兵。集团将按国家文化大数据标识基地建设的要求进行积极探索,为扩大试点成效积累经验,发挥示范引领作用。实施国家文化数字化战略,建设国家文化大数据体系,是国家使命、历史责任,是实现中华民族伟大复兴建立民族自信的基石也是重中之重。
国家文化大数据标识基地建设工作是一个起点,让我们抓好机遇,从责任出发,汇集各方力量,群策群力。扎实文化资源基础,融汇科学的数据标识技术,让我们手里的数据关联起来,让我们的文化活起来。携手共进,一起实现《“十四五”文化发展规划》远景中建设国家文化大数据体系的伟大目标。
运营机构:鄂尔多斯国家级文化和科技融合示范基地管委会
Email:ordoswh123@163.com 服务电话:0477-8394929