导读:在科技蓬勃发展的当下,文化数字化面临挑战。为应对挑战,本文介绍了文化数字化操作系统,作为践行文化数字化战略落地落实的抓手,对于推动中华文化的传播,提升中华文化的国际影响力,满足公众对于文化内容的需求,具有重大的现实意义和深远的历史影响。
一、新科技涌现的时代,文化数字化面临挑战
随着数字技术的蓬勃发展,新兴技术层出不穷,人工智能更是进入成果涌现阶段。“周虽旧邦,其命维新”,当古老的中华文明与新兴的数字科技迎面走来,文化数字化战略成为双向奔赴的普遍共识。
中华文化源远流长,历史悠久,拥有丰富的文化遗产。古籍、书画、碑刻、民间艺术等都是中华民族宝贵的文化资源。然而,许多中国书籍和纸媒素材缺少数字化,文化元素的挖掘和关联亟待加强。与此同时,随着科技的飞速发展和全球化的推进,中华文化面临着巨大的传播挑战,急需提升在全球文化传播中的影响力。
国家文化数字化战略的最终目的,是实现“中华文化全景呈现,中华文化数字化成果全民共享”,这是中华民族复兴的题中应有之义,也是夯实文化自信、增强国家凝聚力的必经之路。落实国家文化数字化战略,必须广泛应用世界范围内领先、普惠的数字化技术,用于挖掘、呈现、传播中华文化。
(一)文化数字化的紧迫性
在全球化的今天,文化交流变得越来越频繁,文化的影响力和话语权也越来越重要。如何在国际舞台上提升中华文化的影响力,成为一个重要的议题。中华文化数字化程度,不仅影响中华文化在国际上的传播广度,也影响其在全球文化舞台上的话语权。此外,随着科技的发展和全球化的进程,公众对于文化内容的需求也在不断升级,对于文化内容的权威性和质量有着更高的要求。
然而,由于现有的文化资源分散、未经系统整理,公众往往难以获取到权威、高质量的中华文化内容。如果中华文化的文化素材、生产能力等不能同步升级,中华文化的吸引力和传播力都将会在思想市场上受到挤压。
所以,文化数字化操作系统在提升中华文化的国际话语权、提供权威内容以及缩小技术代差等方面具有重大意义。
(二)文化数字化的挑战性
中国数千年遗存下来的古籍如浩瀚之海,而海量中国书籍和文化素材都缺少数字化、结构化、标准化,文化数据的挖掘和关联亟待加强。据不完全统计,中国现存古籍总量达5000余万册(件),仅汉文古籍品种就超过20万种。国家图书馆数据显示,截至2023年1月,全国已累计在线发布古籍数字资源13万部(件)。
由此可见,仍有海量中华文化数据处于“离线”状态。对于这些珍贵文化数据的数字化,是一场与时间的赛跑,很多古籍由于保存不善,随时都可能“物理消失”,使一些宝贵的中华记忆永远被抹去。
虽然近年来中国在文化数字化方面已经取得了一定的进展,但仍面临诸多问题。
首先,书籍和纸媒素材的数字化进程相对缓慢,许多珍贵的文化资源尚未得到充分的利用。
其次,对于文化元素的挖掘和关联,当前的研究和实践尚未形成系统性的标准和技术体系。
最后,文化资源的可视化呈现和传播,同样存在技术瓶颈和传播渠道不畅的问题。
为了解决上述问题,打造一个有效的文化数字化操作系统显得至关重要。它将有助于提升书籍、方志等的数字化水平,推动文化资源的整合与利用;同时,通过对文化元素的挖掘和关联,为学术研究和文化传承提供有力支持;此外,通过可视化呈现和传播,有望提升中华文化在全球的影响力,促进文化的交流与传播。
文化数字化操作系统是对中国传统文化进行数字化、结构化、可视化呈现和传播的一种有效手段。通过对书籍、方志等文化资源进行数字化处理,将有助于解决文化遗产保护、传承和传播的难题,同时也有利于挖掘文化元素之间的联系,构建更为丰富的文化图谱。
二、文化数字化操作系统:践行文化数字化战略
作为国家级科技企业,新华智云自成立之初,就致力于以数字科技赋能文化行业,在2017年提出MGC (Machine Generate Content,机器自动化生产)概念,2022年领衔制定全球首个MGC标准。新华智云在2017年率先发布“媒体大脑”后,又在文旅、会展、金融等行业推出一系列产品,并于2022年整合发布了“文化数字化操作系统”,围绕文化挖掘、文化生产、文化服务三层发力,搭建了可操作、可互动的文化数字化操作系统,确保了文化传播的高效与深入,让更多的人能够接触、理解和享受中华文化。文化数字化操作系统的建设对于推动中华文化的传播,提升中华文化的国际影响力,满足公众对于文化内容的需求,具有重大的现实意义和深远的历史影响。(见图1)
图1 文化数字化操作系统知识图谱体系
(一)文化数字化采集:兼收并蓄,海纳百川
文化数据采集阶段,运用前沿的数据抓取和智能化采集技术,广泛收集各类文化信息,确保数据的全面性和准确性。
1、多元采集地方文史数据,致广大而尽精微
地方数据是中华文化的根基,以地方数据的采集为切入点,重点关注具有地域性,且数字化程度较低的地方志数据。以地方志为建设主体的数据库内,目前收录了北京、河北、吉林、上海、福建、山东、浙江等25省、直辖市、自治区的数字方志资源,含省、市、区(县)三级方志及各类专志,浙江部分村镇、街道还有本级方志或地名志。在地方志数据的采集和分析环节中,将各类原始文化资源采集后入库是数据建设的基础,这一环节从编目体系、内容分析出发:
(1)编目体系:
对各省、市、地区的文化数字资源调研并整理,将数据统一为多级编目体系,包括分类、书名、篇(卷)、章、节等,同时各级存储原始文本、图片、音频等富媒体信息。
(2)内容分析:
通过知识图谱系统提供的智能分析能力,从方志文本中抽取主要的人物、地域、事件、时间、朝代及相关的关系,并同时将各个地方方志中的元素由点连线,进而形成全景文化的挖掘和呈现。在此基础上,文化数字化操作系统围绕人、事、地、物、诗等维度,对海量文史数据进行标签化处理,以方便基于数据透视出更多文化联结,基于数据挖掘出更多文化故事。
诗e柯桥·数字诗路文化体验馆 图源:中国网
例如诗e柯桥·数字诗路文化体验馆,通过大数据挖掘出与绍兴柯桥有关的2000余首诗词,发现最能引发唐代诗人兴致的六大柯桥地点,分别是浙东运河、鉴湖、会稽山、兰亭、若耶溪和云门寺。在这个数据洞见的基础上,一个名为“诗歌灵感地”的展项便应运而生。
同样,在展示温州人精神的思想渊源的永嘉学派馆中,为展示出永嘉学“派”的群像特质及气势,从海量文史数据中,梳理出温州籍历史人物1989人、人物关系数据2957组,并经过人工校对和专家审核。在这些文史数据基础上,一批数字化特色展项应运而生,包括永嘉学派源流图、人物数据故事等。用户通过简单互动,就能对永嘉学派的思想精华、传承谱系一目了然。
在新华智云对文化数字化战略的实践中,文化始终是基础和根源,数字化是表达与手段,在扎实的文化内容基础上,再通过数字化手段对海量文化数据进行处理,后续的生产与呈现才会有感染力和传播力,才能展示出中华文化的气派与魅力。
2、多维数据分析,让AI对文史数据从“读懂”到“读透”
在数据分析阶段,运用领先的人工智能技术,对采集到的数据进行深入解析,从中挖掘出文化知识。这不仅可以帮助我们理解文化现象,还可以提供更深层次的文化洞察和趋势预测。
在对地方数据进行挖掘的过程中,可以发现除了传统的文本类信息外,还包含丰富的图片、音频、视频等珍贵的地方数据资料。为此基于智能标引系统构建多维度标签体系,通过多模态算法能力对图片、视频等媒资数据进行理解和标引,挖掘出数据蕴含的丰富内涵。
在完成了文化数据的结构化处理后,通过文化知识图谱系统,将各种文化元素和资源通过实体和关系的数据组织方式进行有效关联,再通过有效的数据可视化和探索分析,可以为用户更好地呈现文化知识的脉络,向用户讲好文化故事。文化知识图谱管理系统主要有两个方面的能力:
(1)对各种不同类型来源的文化数据(书籍、杂志、方志、网站、图片和音视频等)进行智能加工、分析、关系抽取和导入,从而构建出文化知识图谱,同时系统也提供相应的管理功能对库中的数据进行编辑和校对。
(2)提供丰富的图谱内容检索功能,以及图谱探索方式呈现文化数据之间的复杂关联,挖掘文化数据中的新故事。通过人工智能快速“拆读”图文资料,可以迅速构建其中的知识图谱,帮助人工梳理其中的文化线索与脉络,可以协助快速发现数据洞见。
新华智云在实践中发现,围绕红色历史、改革开放历史的挖掘与传播工作,由于此类历史资料多为文本素材,甚至是手抄本,数字化程度较低,但是文献资料数量庞杂,一个地级市的革命文献资料动辄数百万字,如果加上未经整理的红色报刊、文件文献等,其数据量更是难以估算,研究者难以通读。通过AI技术对其快速实现从数字化到结构化的过程,则可以帮助梳理出历史脉络与框架,发现有价值、有意义的红色内容,从而为后续传播提供宝贵素材。
(二)文化数字化生产:文化“活”起来的必要条件
在完成了文化数字化的采集和分析后,进一步利用可视化技术,将知识图谱以易于理解和接受的方式呈现出来。例如,通过互动式的时间线,用户可以清楚地看到中华文化的发展脉络;通过网络图,用户可以直观地了解各种文化元素之间的关系;通过地图,用户可以了解各地的文化特色和文化遗产的分布情况。
文化数字化操作系统通过文化数据到内容生产的系统化联通,通过MGC将地方文化数据结合不同的主题、可视化样式,生产成可以灵活应用到线下、线上等丰富场景的应用中。传统意义上的数字内容的制作成本主要包含人力成本和时间成本两部分,MGC自动化生产技术可以打破人工内容制作的产能限制,结合数据平台的动态数据源,做到秒级合成和个性化的推送,大大降低数字内容的生产运营成本,结合灵活的可视化应用场景,做到文化常看常新。
数字化生产的目标是实现中华文化的全景呈现,通过MGC生成平台,实现了文本、图片、视频的多模态生产的自动化,丰富了文化内容的呈现方式;将挖掘出的文化知识以直观、生动的形式展示出来,使用户能够直接感受到文化的魅力和力量。与此同时,以基于大语言模型的交互能力,来丰富数字化内容的互动,使用户可以更轻松地参与到文化知识的学习和分享中来,进一步推动文化的传播和交流。
(三)文化数字化服务:实现文化“三可”
中华文化有着典型的家国天下的依次递进层级,因此实现中华文化的全景呈现,必须围绕家族文化、地域文化依次递进到中华文化。
通过文化数字化的采集和生产,进而向用户提供服务,这为中华文化的传播和推广提供了一个新的有效途径,从文化的不同角度,实现中华文化的全景呈现。截至目前,新华智云以浙江、江西为试验起点,通过深入挖掘家族文化与地域文化,已经建成超过23座文化数字化体验馆,在其中将文化生动呈现,真正实现可看、可听、可体验(简称“三可”)。(见图2)
图2 在浙江建成的21座文化数字化体验馆
1、地方文化全景呈现
在文化类展馆的建设中,经常会有将地方文化进行全景展示的需求。知识图谱可视化,可以很好地解决这个需求,将地方文化以“灿若繁星”的方式进行三维全景展示。
首先,对地方文化的元素——人物、地点、作品数据进行整理,然后进行关联。例如江右文化,根据江西省委宣传部策划出版的《江西文化符号》丛书,分为临川文化、庐陵文化、豫章文化、陶瓷文化、书院文化等,将数据打上主题标签,建立实体关联,即形成一张江右文化图谱。
又如九江锁江楼数字展陈,仅历代写庐山、浔阳江、浔阳城的诗歌就有近20000首,可视化过程首先对所有数据进行搜集整理,然后进行标注,形成地点-人物-作品图谱,即可一图看尽九江诗文之若“群星璀璨”。(见图3)
图3 九江诗词文化全景呈现
2、家族文化的全景呈现
家是社会最小单元,家族文化也是传统文化、地方文化的大宗。结合方志和家谱,构建姓氏图谱,展示姓氏脉络源流。临海诗路数字体验馆,馆址本身是吴越钱氏府邸,因此在馆内落地一个钱氏家族的数字化展项,从吴越钱王钱镠,穷尽其直系旁支,展示其谱系流传、社会脉络、后世评价,并且结合“钱镠铁券”等实物,构建一个“钱氏图谱”,对这样一个颇具代表性的大族进行全景展示。
充分利用方志,对各姓氏的来源、迁入朝代、分布等情况进行结构化处理,可以自动生成姓氏源流图。通过自动化内容生产系统,快速批量化生成姓氏衍脉短视频。在江山清漾毛氏祖居地陈列馆中,结合家谱与文史资料,通过大数据梳理出毛氏家族五十余代人的衍脉图,将其中于史有传的人物予以高亮呈现,且深挖其背后的文史关系。同时以此为契机,系统梳理了中国四百个主要姓氏的起源、分布以及名人家风家训数据,以家风家训的内容呈现,让每位游客都能找到自己姓氏的起源与先贤风范。
三、善用科技,实现可持续文化数字化
(一)整合多方力量,完善文化数字化生态
国家文化数字化战略的落地,离不开多方协同努力,最终实现文化数字化生态的完善。从文化生态来看,需要完善官方、高校、企业、民间组织、专家、个人爱好者等完整生态,能够确保国家文化数字化战略在成果端实现全民共享,在文化数字化供给端能够实现全民参与。可以借鉴技术圈开源社区的做法,建立完善中文主题的文化数字化开源社区。同时,要充分利用社区、学校、图书馆等公共资源,鼓励公众参与到文化基因库的建设中来。
从技术生态来看,由于文化数字化涉及的技术链条长,涉及技术多,可推动政府部门、研究机构和企业联手,利用现有技术手段,如大数据、云计算、人工智能等,进行文化资源的采集、整理和分析,构建完整、全面、丰富、多样的中华文明数据库。
(二)善用新兴科技,加速文化数字化落地
随着大语言模型的迅猛发展,相关文化数字化技术与应用将会层出不穷,如果利用得当,对国家文化数字化战略落地将带来巨大的助推作用。具体而言,在以下领域大语言模型可能会有突破性应用:
1、内容生成与理解:
大语言模型可以理解并生成文本,这对于文化数字化将有重要的支撑作用。例如,利用大语言模型来理解文化内容,这对于加速构建中华文化数据库、完善文化数据服务平台、推送文化数字化传播和教育都具有重要支撑作用。
2、自然语言交互:
大语言模型可以与人进行自然语言交互,这对于文化的传播和普及具有重要意义,为加速实现中华文化成果全民共享做出有力支撑。例如,它可以作为一位虚拟导游,为游客提供关于文化遗产的讲解;也可以作为一位虚拟教师,为学生讲解文化知识。
总的来说,大语言模型是推动中华文化数字化的重要工具,它可以帮助人们更好地理解和传播中华文化,也可以提升中华文化在全球的影响力。
运营机构:鄂尔多斯国家级文化和科技融合示范基地管委会
Email:ordoswh123@163.com 服务电话:0477-8394929