基于八叉树的地震数据分布式存储与计算

2022-11-05彭成

智能计算机与应用 2022年10期

彭成

（中国石油化工股份有限公司石油勘探开发研究院，北京 100083）

0 引言

随着地震采集及电子扫描技术的发展，产生了海量的地震数据。地震数据的特点是单一文件数据量大，经常达到TB级别，因此需要采用合适的存储技术来提升访问效率。常用的技术、如分布式存储减少了本地的空间占用，通过将地震数据分块，一方面对局部区域的获取提升了效率，另一方面分块小数据更加灵活，可以在不同存储节点间进行迁移和备份等，相比于单一文件存储更加可靠。

在地震数据的获取和使用上，由于地震数据的文件数据量大，缓冲技术的使用必不可少。地震数据常用的访问方式为按照线道方式的剖面获取，遍历整体地震数据体的属性计算和反演计算，以及任意方向三维切片显示等。对于不同的数据获取需求，最适合的缓冲策略也不同，如何设计较为均衡的缓冲策略以支持多种不同的使用场景，是提升地震数据存取效率亟需解决的研究问题。

在高效的分布式存储和缓冲策略前提下，需要将其真正应用到地震反演等处理中，就还要配套的分布式计算框架。目前主流的分布式并行处理框架包括谷歌分布式文件系统等，是比较易于扩展、并能应用到不同领域中的架构。基于现有的并行编程模型，开发出适合地震数据文件特点以及符合地震计算流程需求的计算框架，才能充分利用分布式子块形式存储的地震数据。不同编程模型的取舍及实现的复杂度主要体现在—合适的并行粒度需要根据计算量、通信量、计算速度、通信速度进行综合平衡，同时设法加大计算时间相对于通信时间的比重，减少通信次数、甚至以计算换通信等。不管选用何种并行编程模型，均会涉及到任务划分、通信分析、任务组合及处理器映射等关键环节。

本文在参考谷歌文件系统基础上，利用三维空间下八叉树结构与编码的快速空间定位机制，实现对三维大数据体的结构分块存储，同时设计了基于地震道的一级缓存和基于子块的二级缓存结构，提升了数据访问效率。进一步，设计实现了地震属性的分布式映射归并计算方法，为大数据背景下三维数据体的高效存储与处理分析提供了技术支持。

1 八叉树编码与分块存储

八叉树结构适用于对三维数据的分块，广泛应用于三维图像领域，即把三维数据立方体分割为8个子块，每个子块进一步切分为8个，直至达到合适的粒度。通过读取子块代替读取整个文件，可以提升图像的查询显示效率。

1.1 地震分块配置

对地震数据按照设定的分块大小进行八叉树切分，子块采用线性莫顿（Morton）编码。莫顿码按照大小排序得到子块自然数编码（Tile ID）。在利用八叉树子块来读取地震数据时，通过输入的主测线号，联络线号和深度范围得到其在源地震数据立方体中相应的空间范围，进而转换成一组对应的Morton编码，再转换为Tile ID，定位到在文件中的存储位置。

地震子块文件命名采用随机64位哈希编码（uuid），每个子块文件命名为”XXX（uuid）.afs”。子块有Morton、Tile ID、uuid三种码，与子块一一对应，从莫顿码和子块大小可以推导出对应的空间位置，从而实现编码和位置信息的关联。在分配存储节点时确定一个子块需要传输到哪些存储节点中，采用的是一致性哈希算法。

分布式存储的结构包括本地（local）、存储管理服务（master）、子块存储服务（chunk）三个类型的对象，其中local存放了待切分的源地震数据，master中存放切分和chunk节点的参数配置，chunk节点中存放子块及地震测网信息。master及chunk节点基于远程调用框架（Remote Call Framework，RCF），运行数据存取服务程序。子块平均分配传输到各个chunk节点中，实现分布式存储。

1.2 子块切分与传输

为提升切分生成子块的速度，减少读写文件对象切换及尽量顺序读写文件，本文中子块的传输通过中间文件进行周转。将源地震数据按照存储节点中逐个节点切割一份中间文件。中间文件数据全部属于对应的存储节点，存储节点的数据也全部来自于此中间文件。此后将中间文件传输到对应的存储节点中。如图1左半侧可以看到，本地工作包括源文件的顺序读取与中间文件的顺序写入。

图1 地震数据切块流程Fig.1 Seismic data segmentation process

每次读取源数据若干个地震道，默认读取数据量为100 MB，并顺序遍历各个存储节点，将这批地震道数据中属于当前存储节点的数据写入其对应的中间文件。数据与存储节点的对应关系通过八叉树的切分方法来计算得到。在存储节点中，对接收到的中间文件，每次顺序读取100 MB左右的数据，将数据写入到各个子块中。如图1右半部分所示，遍历这100 MB左右的数据，每次读取最小单元的子块号和在子块中的位置，再将最小单元数据写入到对应的子块文件中。通过中间文件实现了源文件的顺序读、中间文件的顺序写，且减少了写对象切换的频率。读取地震数据与切分相反，也通过中间文件进行，实现源文件的顺序写、中间文件的顺序读。

2 多级缓存建立及利用

构成地震数据文件的基本单元是地震道，一级缓存就是在内存中存放一组地震道，每次查询请求传过来时，查找对应的地震道。通过命中次数计数，优先删除使用次数少的结果。

二级缓存是对子块的缓存，当一级缓存无法命中，就会继续从二级缓存去寻找。每个二级缓存相当于将一个子块文件加载到内存中，数据结构包括Morton码、Tile ID、命中次数等。

2.1 一级缓存的生成及利用

以地震道为单元的一级内存缓冲，缓存的是不同时窗范围、多次读取子块地震道数据合并后的地震道数据。一次具体的生成和利用如图2中左半部分所示：

图2 分级缓存读取地震道逻辑图Fig.2 Hierarchical cache reading seismis channel logic diagram

（1）对于输入的主测线号、联络线号、时间范围，在地震道缓存中寻找相同主测线号、联络线号的缓存，如果找到，则判断缓存的时间范围是否能覆盖输入的时间范围；如果无法命中，继续查找二级缓存。

（2）当缓存道时间起止范围无法覆盖查询道的时间起止范围时，缺少的部分从二级子块缓存中查找，而后将得到的数据与当前缓存中的地震道拼接；如果缓存时间范围可以覆盖用户查询请求，则直接使用此缓存地震道并增加缓存命中次数。

（3）将得到的地震道缓存按照用户查询请求的时间范围进行截断，生成地震数据并返回。

（4）当缓存道数量超过上限时，根据各个缓存道命中次数的多少，删除命中较少的缓存道，剩余所有缓存道的命中次数统一减去一个数值，数值大小为所删除的所有缓存道中命中次数最多的值。

2.2 二级缓存的生成及利用

一级内存缓冲未能覆盖被请求的地震道数据时，根据主测线、联络线及时窗范围，转换为八叉树的莫顿码及对应的子块文件存储位置，询问以八叉树子块为存储单元的二级缓存。具体的流程见图2右半部分：

（1）如果找到二级缓存子块，命中计数加一；如果没有找到，则读取分布式子块数据并建立子块缓存。

（2）如果前期找到一级地震道缓存，可将子块数据拼接到地震道缓存中，如果没有找到则新建一个地震道缓存，时间范围为用户查询请求的范围，将子块数据填充到地震道缓存中。子块数据拼接和填充的流程方法为：根据子块数据所代表的时间范围，与地震道缓存的时间范围比较得到子块数据相对地震道缓存数据的具体位置，并替换已有位置上的数据或者填充到已有位置。子块缓存拼接、填充或替换地震道缓存如图3所示。由图3可知，对于缓存地震道时间起止范围内的情况，采用填充或者替换的方法；对于时间起止范围外的数据，采用拼接的方法。

图3 子块缓存拼接、填充或替换地震道缓存Fig.3 Subblock cache splicing，filling，or replacing the seismic channel cache

（3）当子块缓存数量超过上限时，删去较早且使用次数较少的子块缓存，同时其他所有子块缓存的命中次数统一减去此批删去子块缓存的命中次数。

（4）将得到的地震道缓存按照用户查询请求的时间范围进行截断，生成地震数据并返回。

3 分布式映射归并计算

对批处理编程模型而言，任务划分与高效执行是建立在合理的数据粒度切分基础上。本文中的Map-Reduce是面向地震数据分析的服务，可执行常见的切片、地震属性分析及反演等算法，每一个映射服务（）或归并服务（）本身又是一个多线程执行框架。

3.1 部署映射归并服务

映射归并服务的结构包括任务管理服务（）、映射服务（）、归并服务（），配置包括和端口、工作目录，服务之间的数据传输基于的开源代码实现，实现心跳、消息传递、广播、事件服务等多种异步调用机制调度宕机的任务服务及发现新加入的任务服务，并合理安排计算过程。

地震数据属性计算模块参数配置包括计算的测网及深度范围，不同的地震属性计算有各自特有的计算参数，输出包括若干地震数据体或若干地震数据切片。在进行映射归并计算时，运行流程如图4所示。由图4可知，首先将用户配置好的属性计算参数传给、，并从分布式文件数据块按照约定的计算数据体大小获取所有计算单元（），通过遍历分布式地震数据子块（），提取数据。然后遍历每个子块中的数据，以键值对（）为单位进行计算。键值对是地震数据与对应空间范围对应关系的结构数据，对其进行属性计算后将结果写入、并传给。

图4 Map-Reduce计算框架时序图Fig.4 Map-Reduce computing framework sequence diagram

所有算得中间分析结果后，通知进行归并，遵循键值对提取同一类别中间计算结果（），遍历并根据约定的算法归并最终数据块文件（），形成及建立分布式结果存储文件结果（），得到最终的计算结果，再上传到节点中，完成分布式计算。所有和内部计算基于多线程执行。

Map-Reduce计算的关键步骤如图5所示。由图5可知，从不同的获取待处理的粗粒度数据文件并读取键值对，执行匹配的地震属性计算函数，中间产生的结果存储到圆形内存缓冲区（先进先出类型），达到阈值后写入本地硬盘、且初步归并（）形成面向不同的子块文件。通知所属的子块文件都在哪些里并进行下载。获取到所有中间键值对后，就按照键值对的键进行归并排序形成中间临时文件。对于相同键的一批键值对，将其数据全部传给Reduce算法函数执行，将结果写入最终的输出文件。

图5 Map-Reduce关键环节示意图Fig.5 Map-Reduce key link diagram

3.2 分布式映射计算

分布式计算流程如图6所示。由图6可知，首先通过获取到和的地址并初始化与其连接的接口服务，接下来会为其分配各自负责的子块文件。和分配时，在平均分配子块的基础上，另需考虑避免超过剩余存储空间。各个和所负责的子块配置好后，本地将给其传送地震属性计算参数，开始进行计算，计算完成后再将计算结果发送过去。归并生成最终计算结果，此后传回本地及节点，实现结果的分布式存储。