迈向文化遗产数字化的综合方法:从调查到信息管理的案例研究

考古研史赏人物 2025-03-07 17:56:40

全文刊登于《中国文化遗产》2024年 第1期 P17-26

一、背景

近年来测量技术在方法和仪器,尤其是使用便捷性、现场调查效率和最终数据质量等方面取得显著进展。这种进展为整个建筑、工程和施工(Architecture, Engineering, and Construction,简称“AEC”)行业带来明显好处,使从业者能够获得并使用准确可靠的建筑空间三维重建。该行业的各个学科,尤其文化遗产管理领域在现实采集(reality capture)和数字化技术的发展中受益颇丰,无论在几何重建还是表面描述方面,都有助于完成扩展、详细和系统的建筑遗产建模。

即便是对于最先进的数字化工具,每个文化遗产(如单个建筑物、考古遗址甚至文物)的特定需求都可能具有挑战性,比如会限制操作员和仪器自由移动的空间条件,对象的物质特殊性等等。考虑到每个文化遗产的固有特点,每个数字化项目都应该采用定制的方法[1]。从开始仔细评估所需分辨率、数据的最终使用等,到根据场地环境条件、空间特征情况,选取最合适的调查工具。还需考虑到截至目前和未来将产生的大量数字化信息,由于可用调查数据成果的数量和规模的增加,迫切需要数据利用方面可持续和稳定的解决方案。此外,文化遗产领域需要不同专业知识背景的人员协同工作,需要具有用户友好性、高效的数据共享以及在现场使用方面成熟的信息管理系统。

通过三个文化遗产数字化案例(奥斯塔的圣母升天及洗者若翰座堂、罗马的古罗马广场鸠吐纳喷泉、米兰的主教座堂)讨论对应复杂建筑空间条件下的多传感器数据集成、建筑信息采集与管理流程协同以及大型建筑遗产数字化中数据处理与应用问题,本文旨在阐述一种以案例为导向的文化遗产数字化通用方法。

二、数字化方法

文化遗产数字化处理方法应该从开始就将所有流程视为一个整体。在工作初始阶段综合评估用户需求(色彩、精度、误差等有关主模型质量的标准设定)、文化遗产环境对采集工作的具体限制与影响、可能的下游及协同工作需求(数据格式兼容、操作工具与平台、自动化处理等),并由此规划整个数字化工作。

首先是获取用户的主要需求,初步判断适合的调查技术和实现目标的解决方案。调查技术及针对性调查策略的采用对最终结果有重大影响。使用地面激光扫描仪(TLS)等多种技术与无人机摄影测量或移动测绘系统(MMS)相结合,可以减少未测量区域、提高最终产品质量以及调查的准确性和稳健性。在可能的情况下使用全站仪进行地形测量,以获得一些用于缩放和精度控制的尺度信息。在数据处理阶段某些技术采集的最终结果可能会受到数据的配准或对齐的影响,因此可以利用现场获取的控制点(control points),确保数据处理后的最终质量达到精度目标。此外,因文化遗产地向公众开放,实地调查可能会干扰公众参观或其他与遗址相关的活动,通常在特定的限定时间内进行,因此应仔细评估调查活动可能存在的约束和限制。

在满足误差范围要求的数据采集完成后,下一步是将获得的点云和网格数据合并到一个模型中,作为主模型(Master Model)。主模型是通过在点云或Mesh网格的重叠部分之间选择最重要、准确或具代表性的数据来构建,它代表了所获取数据的总体,也是三维测量最具代表性的成果。

调查数据的最终交付通常是通过本地文件进行的。在可能的情况下,最好使用非专有文件格式,无论是作为数据总体的主模型,还是在处理阶段可能产生的任何二维表示数据(CAD矢量图、正射影像等)。尽管文化遗产领域对三维数据的需求不断增加,但由于这种二维表示数据具有使用便捷性和格式的长期兼容性,其仍然占据主导地位。

在AEC行业中,数据利用的一个重要前景是用Web平台来管理利用3D数据。Web平台作为通过网站(Web App)访问的软件,为用户提供查看、与点云数据交互的工具,这些数据可以是已经存储在系统中的,也可以是上传并由平台处理的数据。可以与3D数据互动的“程度”取决于启发平台的目的和目标:承诺从数据显示工具演变为完全基于云的处理软件,这也是Web平台未来发展的关键。Web平台的优势之一是提供了用于物理服务器上虚拟机资源,允许用户在不使用专门的高性能硬件和专用软件的情况下处理大点云或网格模型;另一优势是所有数据都由服务提供商托管和管理,初始上传阶段结束后,最终用户无需使用和存储大量重复数据。这两个优势可以在硬件和软件方面节省成本。不过一些平台需要订阅使用,其价格根据可用功能、提供的服务和可用的存储空间而变化。

与在本地机器上工作的情况相比,Web平台的另一个显著优势在于它增强了用户之间共享最新信息和数据的可能性,减少了数据重复和版本增多等问题。由于通过Web浏览器访问平台,而且潜在地可以从任何数字设备访问,因此可视化模块通常会根据设备的计算能力进行调整,为了进行快速的呈现,在上传过程中点云便会被索引。因此对于没有可以可视化3D数据的软硬件的非技术人员和偶尔使用者,也能更容易地使用Web平台来管理3D数据。

三、案例

(一)奥斯塔圣母升天及洗者若翰座堂

近年的实践和研究呈现出使用从多个传感器获取集成数据的趋势,特别是文化遗产领域中大型调查项目,复杂的场地物理条件需要利用多种传感器来适应。在数据融合的实践过程中,早期是将地面激光扫描(TLS)测量与建筑装饰等的近距离摄影测量相结合[2],然后将 TLS 与外部无人机(UAV)摄影测量相结合[3],使用激光扫描作为匹配地面摄影和UAV摄影测量的“桥梁”[4],以及最近讨论的室内 TLS 与室外摄影测量匹配[5]。

这个案例是以多传感器方法为基础,对一座复杂精致的历史建筑进行调查和研究:意大利奥斯塔(Aosta)古城的圣母升天及洗者若翰座堂(the Cathedral of Santa Maria Assunta and San Giovanni Battista)的两座钟楼和后殿。座堂的建立据信可以追溯到四世纪末,由于在相当长的时间内间续的建筑干预,呈现出复杂且清晰的历史分层。

建筑复杂的结构、形态以及众多构件使得进行全面的维护和保护活动变得困难。实际上,座堂中更容易参观和进入的部分多年来已经进行了大量的干预,而次要区域,包括钟楼和后殿,至今仍然遍布病害,问题颇多。作为调查的一部分,有必要研究两座方形基座钟楼的保护现状。尤其是砖结构内外表面,以及与结构相关的所有空间,如地下室、阁楼、楼梯和狭窄通道。

鉴于对象的复杂性、多样性和不可及性,决定采用多传感器方法。项目中采用了以下调查技术:TLS、地面数码单镜头反光(DSLR)近距离摄影测量、无人机摄影测量、多摄像头摄影测量以及全站仪测量,以实现整个测量活动的支持架构(图 1)。

图1 从左到右:从座堂北侧钟塔望向南侧钟塔,南侧钟塔上钟室的TLS扫描,座堂后殿的全站仪测量,使用多目摄像机Ant3D调查阁楼

TLS、无人机摄影测量通常用于更大的、室内外易采集的建筑表面。多摄像头摄影测量用于所有可及性极差的狭窄空间。这个案例研究采用的方法独特之处在于,多摄像头摄影测量被用作主要参考来定位其他传感器所采集的信息。多摄像头调查是使用一个由五个鱼眼相机组成的Ant3D原型[6]。Ant3D因其作为手持仪器的便利性得以在多目相机调查中连接,并协同匹配不同采集信息,专业人员使用它通过连续行走调查大量延伸区域,其他采集技术则用于更准确地覆盖座堂的特定区域。Ant3D对于测量狭窄和难以访问的空间,如隧道和塔楼,是唯一可行和节省时间的工具,为调查带来了许多方便,它被用作“主干”点云以供参考。最后作为一般参考和控制,在可访问的区域进行了地形测量。最终实现的准确性为15毫米,满足1:50表示比例的精度要求[7](图 2)。

图2 根据数据源着色的座堂最终点云(东侧)

数据的相互验证是通过交叉截面检查进行的,在各个部分的分割和最终组装之后,获得了具有均匀特性的完整点云,并作为主模型交付。然后将所有数据收集到Web平台FlyVast[8]中,为专业人员提供进一步干预的数据和信息。

修复项目中涉及建筑师、修复师、测量师、考古学家和座堂管理机构(Chapitre de la Cathédrale)的管理者等众多专业人员,需要无缝数据共享和对同一数据集的远程协作,因此项目的点云通过FlyVast平台承载。该平台具有流畅的可视化性能,并提供实用的注释工具,允许用户查看、查询和丰富点云的信息和数据,增强了3D用户体验。渲染模块允许用户根据当前的任务,通过滑块手动调整渲染的点数,以满足平稳的数据加载和浏览。可用的注释工具支持用户之间的互动和信息共享,并允许突出显示特定区域以进行检查。此外,该平台提供的切割工具允许用户通过绘制切割线或指定坐标来创建更精确的切割,这个工具是项目中涉及的建筑和修复人员的主要需求之一,因为它使用户能够从点云中快速提取2D表示。就笔者所测试的Web平台中,FlyVast为此项需求提供了最大的便利(图3)。

图3 FlyVast 平台上加载的座堂的最终点云

左侧以最高分辨率(5 毫米)显示完整点云,并高亮显示了南塔;右侧是北塔内部的剖面示意图

(二)罗马的古罗马广场

罗马广场是位于罗马的一个考古遗址,是斗兽场考古公园的一部分(Parco Archeologico del Colosseo,简称“PArCo”)[9]。该区域主要是室外空间,具有多个历史时期的不同结构。PArCo 的管理办公室负责监督整个维护和修复过程,其中也包括定期的数字化工作和对结构的持续监控。

整个研究项目的主要成果为一份数字化指南, 它系统性阐述了各操作步骤、数字化需求以及在 PArCo管理部门用于监控和管理目的的web平台上的数据。旨在为 PArCo管理部门推动的未来数字化工作提供参考指南,并对参与的专业人员的工作提出具体要求。此外,它还描述了平台上共享的数据处理和上传流程。

考古公园数字化档案由“考古遗产保护和教育系统(SyPEAH )”网络平台管理,该平台还管理数字化过程及来自现场采集、调查、地质图和卫星数据等大量数据。SyPEAH是一款专门针对地理空间功能而开发的 Web 应用程序,主要考虑到考古公园占地面积广阔,而罗马广场的主要是室外区域,加之调查的主要目的之一是定位监测传感器、警报事件,以及实现地理信息地图和卫星图像的可视化[10]。该平台支持点云、3D 和 BIM 模型,并具有特定可视化模块。

一项测绘调查为该指南提供了数字化流程的合理示例。该案例位于罗马广场的西南部,调查对象是一座建于公元前二世纪的古泉水遗址上的许愿建筑鸠吐纳喷泉(Lacus Iuturnae - Giuturna Spring)及周边地区。选择该地点是因为它呈现出不同的建筑形态以及不同类型和尺寸的建筑元素。勘察范围总体面积约1100平方米,包括室内、室外和地下空间。调查于2022年5月进行,采用多传感器和多技术方法,以尽量覆盖全部调查区域,目标分辨率为5毫米,适合1:50的表示比例。此次调查使用了多种仪器:TLS、室内外区域摄影测量、无人机摄影测量、用于地下区域的Ant3D手持式多目相机摄影测量系统,以及用于采集地面控制点的地面全站仪(图 4)。

图4 罗马广场的调查工作

从左至右:无人机飞越鸠吐纳喷泉区域;TLS测量;全站仪测量

集成了来自不同测量技术的高分辨率点云,最终输出是一个5毫米分辨率均质采样的主模型。主模型覆盖了鸠吐纳喷泉的整个区域,旨在以最大分辨率描述考古对象,最大限度地覆盖全部区域,完整记录该遗址(图 5)。

图5 左侧:均质采样下的5毫米分辨率主模型,右侧:主模型的喷泉细部

主模型最终以整体和手动分割的各部分上传到 SyPEAH 平台(图 6)。由于要分割的类别数量较少,各类别固有特征各异,并未采用自动或半自动分割算法。笔者认为,此类平台未来应提供更多针对建筑要素的功能,用以更高效地描述单个考古要素[11]。考虑到考古公园的规模以及现有物体的多样性,专用于 PArCo 管理的信息平台受益于多尺度方法,并适应特定用例的规模。未来可以关注于对点云的高级操作,设计针对特定建筑规模的数据库实体,对应考古区域的逻辑和语义的细致划分,以及3D数据分割,创建并引入这些新的数据库实体可以精确区分和描述不同考古对象,让 SyPEAH 用户访问更精细的数据和信息,描述单个考古元素及其组成部分的特征(图7)。基于此类需要对园区做总体概述和协调,同时针对特定考古区域制定干预决策的案例时,多尺度方法尤其有效。

图6 加载了鸠吐纳喷泉主模型的SyPEAH平台操作界面(图片来源:Parco Archeologico del Colosseo)

图7 有关SyPEAH平台数据库整合的主张:现存的数据库实体(蓝色)和新近主张的数据库实体(绿色)及其相互关系

(三)米兰主教座堂

为了维持米兰主教座堂的建筑外观,它接受着经年不断的建筑干预:内部和外部可见结构大部分材料是坎多利亚(Candoglia)大理石[12]。这种材料由于环境因素和空气污染,尤其是在室外,降解速度很快。加之漫长的历史建设和几个世纪以来反复出现的各种结构问题,导致其需要定期和循环检查以及相应的持续修复(图 8)。

图8 米兰主教座堂大理石构建更换的例子

左侧为室外,右侧为室内

Veneranda Fabbrica(简称“VFD”)[13],是自1386 年米兰主教座堂建造之初起负责管理工地的机构,并协调所有修复活动。VFD 特别之处在于其监督着每个大理石构件的整个供应链:坎多利亚采石场,加工原材料和完成主教座堂上的替换、抛光或巩固干预的所有设施、工具和专业知识。通常的维护流程如下:(1)根据计划检查主教座堂的特定区域;(2)识别需要干预的石块并通过现场裁剪纸质模板来记录它们的形状;(3)从原位移除石块并插入可调支撑;(4)从采石场开采大理石并根据模板粗略塑形;(5)精确塑造新的石块以插入其位置。

自2008年以来,米兰主教座堂的完整点云已经通过多年积累[14],使用了多种仪器、传感器和技术:从地面激光扫描(TLS)到近距离摄影测量、无人机摄影测量和多相机摄影测量系统[15]。由于修复活动的演变和未测部分的集成需求,座堂的点云也在不断更新(图9)。

图9 米兰主教座堂均质采样后的5毫米分辨率点云

为了能够使用数据量庞大且内容复杂的主教座堂点云,需要依据建筑要素将其分类[16][17]。基于Grilli和Remondino于2019年发表的实践[18],米兰主教座堂的分类采用了机器学习(ML)方法。该方法使用了一个随机森林(RF)分类器,通过对数据集进行部分手动注释来准备完成训练。该分类器使用点云中各点的几何特征,并基于统计学原理完成分类任务[19]。由于点云数据规模巨大,米兰主教座堂的点云分类需要有组织地分步进行,并最终采用了多级、多分辨率方法[20]以克服计算需求和类别过多所带来的问题。在这种方法中,分类工作分布在不同的采样级别中(图10)。各级分类任务中相对较低的分辨率减轻了几何特征计算和模型训练造成的资源负担。分类结果会被插值回相同位置的但密度更高的点云上,以获得下一级分类所需几何细节的更高分辨率,该分辨率取决于需要识别的建筑元素的准确度。与其他常见的分类解决方案相比,尤其对于大规模数据集,该方法更加精确且计算效率更高。

图10 分类处理后的主教座堂点云室内部分,用不同颜色代表了不同类别

为了支持复杂的维护过程,找到数据管理问题的有效解决方案,多年来进行了各种信息管理方面的实践。最重要的经验来自用于修复主塔的一个基于开源模块的BIM3DSG信息系统的实践,该系统的几何基础基于NURBS和Mesh模型[21-23]。这一实践展示出以3D为基础的信息系统支持修复工作全部潜力,但同时受制于模型制作阶段的瓶颈问题,尤其考虑到1:50表示比例所需的准确性。此外,还测试使用了基于制造业的一款产品生命周期管理(PLM)平台3DExperience[24]。结果表明,面对复杂的主教座堂,高效的数据库管理器十分重要,但建模的影响同样地阻碍了它在主教座堂的规模应用。

这些经验指出,如果要把信息系统应用延伸到整个主教座堂上,3D建模可能不是一种可持续的方法,原因如下:(1)建筑空间和内容的复杂性,以及点云的巨大尺度;(2)大理石覆盖物的周期性更换轻微地改变着建筑元素的形状;(3)不断更新的调查需求;(4)主教座堂每个部分和区域的精确测量需求。

目前研究的主要目标是通过直接在专门设计的Web平台上管理点云数据,开发一种有效的系统来支持主教座堂的维护和文档化过程。需要解决的主要问题涉及数据收集、数据的逻辑和语义结构,根据已建立的结构对点云进行分割和细分,以及 Web平台的设计和开发。该平台可以作为一个信息枢纽,连接点云的几何数据和分类维修工作已经产生以及未来会生产的信息和数据。不仅如此,平台应允许用户通过一个视觉导航界面浏览储存的数据与分类的历史档案。该项目的主要立意是在单一的应用程序中汇集所有有关米兰主教座堂的有用信息和数据,使用高效且简洁的工具来支持开展在主教座堂的工作。

四、讨论

建筑空间的数字化对于设备和操作者而言有时会非常复杂,这在文化遗产领域尤其明显。规则、宽阔和无障碍的空间是少见的例外,常见的是狭窄、复杂甚至不可及的空间。这一事实要求测量人员使用不同的采集技术,以便从每种技术中获得最大收益,甚至开发新仪器来解决特定问题。

传感器之间的数据集成一方面可以看作是解决特定数字化问题的方案。例如,TLS点云在表示几何结构方面具有很高的测量精度,因为其传感器是主动式的,不受环境光照的影响。摄影测量可以实现比肩TLS的分辨率,具有精确的色彩表现力,但它受到光照和阴影条件的影响,这可能会影响最终的色彩结果、图像的定位以及测量产品的最终准确性和可靠性。从这个角度来看,数据集成可以充分利用可用技术的主要优势,但另一方面,它也面对挑战,因为每种单一技术都带来了一些特定的问题(如调查持续时间、机动性和处理、照明、远程漂移等问题),而且全部调查数据在目标分辨率下的相互匹配绝非易事,要考虑的不仅是单个点云,还要考虑整个主模型的最终准确性。

通过机器学习对点云数据进行分类可以减少用于给点云提供语义结构的人工操作时间。值得注意的是,目前以点为基础(point-wise)的方法在处理统计数据方面表现出色(如果考虑根据评估数据集,点分配给正确的类别的准确率),但在不同类别之间的边缘附近的点的分配可能会不确定和模糊。这是这种分类方法的常见缺点,因为点的几何特征计算基于特定的搜索半径。根据需要导致后续需要手动重新分类,以获得类别之间的清晰边缘。这显著增加了分类过程中的人工干预,增加时间消耗。目前很难估计整个过程所需的时间,包括因手动干预而花费的时间。

另一方面,机器学习的行为可以从建筑对象的本体研究和定义中受益。当我们使用自然语言来描述建筑概念时,通常其中包含了几何描述、格式塔心理学[25]、文化和背景理解等等。机器学习模型实际上又是以数值矩阵的方式感知物理世界,正如克里斯托夫·莫尔纳(Christoph Molnar)[26]所指出的那样,它实际上是一种基于提供的数据来改善预测或行为的方法。分类中的目标类别应该与样本中集包含的特征描述相互一致。因此建筑概念的本体研究至关重要,它将指示出数据集中缺失的部分或目标类别需要的调整。为了提高机器学习的性能和准确性,本体研究需要定义各种建筑元素,即可能的类别,考虑到其在尺寸、形状或其他特征上的不同可能性。

当前,调查技术似乎比处理、使用和结构化数据的能力发展得更快。现实采集硬件具有很高的可及性,越来越容易使用,且高度自动化,但数据解释过程依赖于复杂庞大的自动化基础,且仍需人工干预验证,甚至是手动纠正或类别重新分配。此外,数据解释阶段是在调查活动之后进行的,现阶段无法提供对建筑空间、可能需要特定工作规划的关键区域的实时反馈。

现实采集数据与对象和特征识别技术的集成是可以预见的未来发展新契机,这些技术目前正在朝着建筑和修复领域的应用方向积极发展。应用范围包括在3D数据中对象识别,例如使用机器深度学习进行点云分割;以及图像处理和识别,例如检测建筑元素的病理现象、图像字幕、分割等[27-32]。人工智能的支持可以促进更具对象性的调查,节省时间和经费以及更明智的计划干预。考虑到当下自动化、实时定位与地图构建(SLAM)技术与在模拟中进行数据采集的测试[33],这些技术可能在某些具体的可及性低或者高度危险的场景中实现无人数据采集。但正如前面所述,长期而言人的干预和理解仍是不可或缺的。

随着人工智能在建筑和修复领域的不断实践,跨学科数据集的制定将是一个可以预见的重要挑战。要制作这样利好多种相关应用的数据集,需要详细的标准、本体研究以及可以在不同学科研究者之间共享和比较的海量数据。

五、结语

正如奥斯塔主教座堂的案例研究所指出的那样,在进行调查活动之前需要根据建筑遗产的物理空间场景,规划不同传感器的采集工作,使得现场调查工作稳妥、精确地执行开展,并仔细处理数据,以提供符合准确性要求的完整模型。

罗马广场的案例研究则重点讨论了文化遗产的数据管理系统,这些系统必须考虑用户之间的差异:专业背景以及其与数据、相关信息的互动水平。文化遗产的数据管理系统必须根据遗产数字化的主要目标进行选择或设计,这主要由目标用户、管理数据以及下游数字化技术和信息利用的可能走向来决定。

从米兰主教座堂的调查历史中可见,三维数据使用的增加、调查技术的发展为文化遗产的数字化利用带来了新的可能。文化遗产数字化实践中应平衡考虑优先事项,并采用适配的技术方法,以适应新的需求与可能性。这种改变发生在生产3D数据的采集和处理流程中,也体现在数据的最终使用上。任何演进和技术改进,尤其是在人工智能和自动处理以及对象识别领域,都应朝着可用性方向进行重新调整。在数据集准备和制定集标准方面,需要来自行业中各学科工作者的更多共识与努力。

[致谢:感谢奥斯特主教座堂教堂的 Chapitre de la Cathédrale机构对研究的支持以及在所开展的活动中的合作。也感谢He.Su.Tech研究团队的建筑师安德里亚·阿达米(Arch. Andrea Adami)和建筑师雅各布·赫尔德(Arch. Jacopo Helder)在无人机调查活动期间提供的支持。作者要感谢考古公园总经理和工作人员,以及Digimat公司的平台开发者。特别感谢米兰主教座堂Veneranda Fabbrica机构和感谢弗朗西斯科·卡纳利工程师(Ing. Francesco Canali)的所有支持和多年的合作。]

作者简介

佛朗哥·斯佩托(Franco Spettu),通讯作者franco.spettu@polimi.it,米兰理工大学建筑、建成环境和建造工程学院博士候选人。

张开,米兰理工大学建筑、建成环境和建造工程学院博士候选人。

艾哈迈德·阿莱利( Ahmad Elalailyi ),米兰理工大学建筑、建成环境和建造工程学院博士候选人。

卢卡·佩尔费蒂(Luca Perfetti),米兰理工大学建筑、建成环境和建造工程学院,地形和制图学研究员。

克里斯蒂安娜·阿奇尔(Cristiana Achille),米兰理工大学建筑、建成环境和建造工程学院,地形和制图学副教授,3D survey group实验室负责人。

弗朗西斯科·法西(Francesco Fassi),米兰理工大学建筑、建成环境和建造工程学院,地形和制图学副教授,3D survey group实验室负责人。

(文章参考文献和注释略)

0 阅读:0