APP下载

基于生成对抗网络的校园总平布局生成式设计探索
——以小学校园为例

2021-09-24邓巧明林文强刘宇波通讯作者梁凌宇通讯作者DENGQiaomingLINWenqiangLIUYuboCorrespondingAuthorLIANGLingyuCorrespondingAuthor

世界建筑 2021年9期
关键词:体育场教学楼布局

邓巧明,林文强,刘宇波(通讯作者),梁凌宇(通讯作者)/DENG Qiaoming,LIN Wenqiang,LIU Yubo (Corresponding Author),LIANG Lingyu (Corresponding Author)

0 引言

随着计算机计算能力的飞速提升、算法的不断改进,以及信息技术带来的海量数据,人工智能技术的发展又达到了一个崭新的高度。在建筑领域,用于设计和建造的数字技术,在过去的20~30 年里一直在改变着建筑师的工作方式,今天的人工智能技术,特别是基于统计学理论,通过经验数据来提升机器智能化水平的机器学习方法也将进一步推动建筑行业的变革。近些年,在结合大量数据样本与机器学习算法模型特点进行建筑风格判别、城市空间特征识别、基于建筑形体的物理性能指标预测、住宅平面的识别与生成等方面已有较多研究[1-5],但结合设计逻辑思维过程探讨基于用地条件与功能需求进行总平布局生成设计的相关研究仍然较少。

总平布局作为设计前期多方案比较与确定深化方向的重要环节,通常需要建筑师综合考虑场地条件、各功能要素的使用需求、设计规范法规等多种条件的限制与要求。以小学总平布局设计为例,既要考虑场地周围道路情况、用地形状等因素合理选择场地主要出入口位置,也要满足教学楼、体育馆、运动场等功能要素的布局与相互位置关系的合理性,同时还要兼顾教学楼的朝向、噪声间距等多方面的要求。这通常需要依赖建筑师大量的设计经验与对全局的把控能力,进行反复测算和比较,才能寻求一个最优布局。本文希望以小学校园总平布局设计作为切入点,探讨利用对抗生成网络的机器学习的理念与方法,实现基于用地周边道路和用地形状等用地条件的校园总平布局设计自动生成的思路与方法。

1 机器学习在布局设计领域的相关研究

布局设计是指在一定范围内将各种要素以合理的位置和相互关系进行有目的组织的过程,涵盖了包括海报排版、文档布局、游戏场景设计、室内家具布局、工艺生产线布局等多个领域,一直是计算机科学领域的重要研究课题。以往的研究更多是将布局设计看作一种模式计算问题,并从计算机视觉、图形学与机器学习等领域引入多种方法[6-7]。最近,神经网络的复兴通过深度学习的方法再次推进了相关研究,通过学习和训练可以建立一个针对布局设计的生成器或预测器[8-9]。

针对建筑布局问题,保罗·梅里尔(Paul Merrell)等人(2010)使用贝叶斯网络学习房间属性关系,在不固定边界的情况下使用随机方法合成住宅的平面布局[10]。刘利刚等人(2019)提出了一种使用深度神经网络与概率推论的方法预测平面各房间位置,并计算房间大小与墙壁位置的两阶段方法来最终生成具有给定建筑边界的住宅建筑平面图[7]。黄蔚欣、郑豪(2018)利用生成对抗网络GAN 实现基于公寓平面图纸的功能识别与基于功能色块图的平面图纸生成过程[11];斯坦尼斯拉斯(Stanislas Chaillou,2019)通过训练3 个GAN模型实现从基地到建筑轮廓,再到平面功能布局以及最后的家具布置的生成过程[12];戴维·牛顿(David Newton,2019)探讨了样本量有限的柯布西耶风格住宅平面布局生成问题,并通过增加噪声、旋转等方法扩充样本量,提高GAN 模型的训练效果[13]。

上述研究中,计算机领域的刘利刚、建筑领域的斯坦尼斯拉斯都探讨了利用机器学习的方法在只给定住宅轮廓的条件下生成住宅平面布局的方法与效果。值得注意的是,斯坦尼斯拉斯的研究还尝试建立了从用地轮廓到住宅平面轮廓的映射变换,从而实现从用地条件到住宅平面功能布局以及家具布置的完整方案生成过程。但如果从设计师进行总平布局设计时的设计逻辑与思维过程的视角来考虑,作为影响建筑布局设计的用地条件,除了用地轮廓或形状之外,基地道路及周边功能情况(住宅、商业、办公等)也都是用地条件的重要组成部分,将直接影响总平布局中主要出入口位置、各功能要素的摆放结果。此外,用地条件与功能需求首先决定了一个合理的总平布局关系,建筑轮廓是在总平布局关系的基础上各功能体块大小与形态的结果,而不是总平布局关系的先决条件。因此,本文希望从设计的逻辑思维与机器学习算法模型特点入手,进一步探讨利用生成对抗网络实现特定用地条件的小学校园布局生成设计的方法与效果。

2 基于Pix2Pix模型的小学校园设计布局生成方法

生成对抗神经网络(Generative Adversarial Networks,简称GAN)是伊恩·古德费洛(Ian Goodfellow)于2014 年提出的一种机器学习方法[14],它包括一个生成模型(Generative Model)和一个判别模型(Discriminative Model),通过两者之间互相博弈的方式来让模型能够解释真实的数据分布规律,进而生成新的图像数据[15]。GAN与其衍生出的变种模型如CGAN、Pix2Pix(匹配图像生成对抗网络)、Pix2Pix_HD 等,被广泛应用于视觉与图像领域,实现图像补全、图像生成(从文字到图像以及从图像到图像等)、图像风格转换等功能。本文采用的Pix2Pix 模型是菲利普·伊索拉(Phillip Isola)等人2017 年在GAN 基础上改进提出,将原有GAN 模型的输入由随机噪点改为图片,并将输入图片与生成结果一起输入判别器,最终实现从图像到图像的学习过程[16]。

本研究构建的基于Pix2Pix 实现小学校园总平布局生成的主要流程:

(1)小学总平布局解析:解析小学校园总平面布局的基本组成部分与特点;

(2)构建数据库:收集和筛选小学校园案例,结合总平布局特点进行样本标注,构建小学校园总平面数据库;

(3)模型建构:利用构建的数据库划分出来的训练数据集训练一个Pix2Pix 模型,实现校园总平布局生成;

(4)实验测试:利用构建的数据库划分出来的测试数据集测试训练好的模型,对输出数据进行定性与定量相结合的分析,评价Pix2Pix 模型的训练效果。

2.1 小学总平布局解析

小学校园的总平布局设计是整个方案设计过程中极为重要的一步(图1),需要综合考虑学校办学规模要求、各功能区使用需求与相互关系、交通流线等多种因素,合理安排校园各主要功能区位置,从而实现对资源高效合理的利用,并为进一步的深化设计奠定重要基础。

1 小学校园方案设计流程图

小学校园的基本功能区主要包括由各种教学用房(教学楼、实验楼、办公楼等)组成的教学区;由各种体育场、球类场地、体育馆、游泳馆等组成的体育活动区;由学生宿舍、食堂等组成的生活区、绿化景观区等[17]。在进行总平布局设计时,应以满足师生教学活动及管理需求为原则,结合学校用地条件与各区的功能特点、物理环境要求、流线组织关系以及相关设计规范法规等对校园主要出入口和主要功能区进行合理安排和组织(图2)。

2 中小学主要功能区关系简图

2.2 构建数据库

2.2.1 数据筛选

样本数据的收集与标注是机器学习研究的基础。小学校园总平设计样本来自政府建设公告官网、各建筑设计网站以及建筑杂志与书籍等多种媒介,需要对收集到的样本按一定的数据筛选规则进行筛选(图3)。考虑到气候、地形地貌以及经济发展水平等条件对总平布局的影响,样本来源集中在具有相似的气候区、地形条件和开发建设强度的设计案例中,以减少不必要的样本方差从而保证模型训练效果。按筛选要求共收集到302 个小学校园总平设计样本。

3 样本数据筛选规则示意

2.2.2 数据处理与标注

收集到的样本需要进一步统一比例和标注方式用于模型训练。首先以标准篮球场作为换算统一比例的基准,将所有样本比例调整为1:1800 放在240mm×240mm 大小的白色背景图像上。然后使用不同的RGB 色块来表示周边道路、用地范围、不同的功能建筑、运动场以及主要出入口(图4)。

4 用不同RGB色块表示的用地条件标签和布局标签(1-4绘制:林文强)

2.3 模型建构

2.3.1 模型架构

根据目前样本的特点和规模以及从图像到图像的生成任务,我们采用基于cGAN 的Pix2Pix 作为小学校园总平布局生成的基本模型[16]。Pix2Pix模型中,生成器采用U-net 架构[17],判别器采用PatchGAN 架构[18](图5)。

生成器(图5,红框所示):生成器采用了16层卷积神经网络(CNN)的U-Net 结构,每层网络的神经元个数分别为64,128,256,512,512,512,512,512,512,512,512,512,256,128,64,3,下采样的卷积核与上采样的反卷积核的大小均设置为4,步长均设置为2,这使得生成器的输入与输出均为相同的大小(256×256),输入的图像先通过前半部分的卷积层进行关键信息提取,然后通过后半部分反卷积将提取到的信息转译为布局生成,通过浅层的特征图短接到相应大小的反卷积层,能够使生成的布局图像更好地保留场地形状、大小和附近主干道信息等约束条件。

判别器(图5,绿框所示):判别器采用了5 层的卷积神经网络结构,每层卷积网络神经元个数分别为64,128,256,512,1,判别器的输入为生成器生成的图像并接上生成器的输入图像,即需要判别真假的布局图像和场地条件图像。网络的最后输出为单通道32×32 的取值为0-1 的真假预测图,预测图上的每个数值对应判别器输入图像的相应位置上的70×70 大小图像分块的真假程度,取值接近0 说明判别器认为生成布局图像上该图像分块的生成效果不佳,取值为1 则说明判别器认为该图像分块的生成效果接近真实布局图像。

2.3.2 模型训练与测试

模型训练:Pix2Pix 模型训练会同时使用生成器与判别器;损失函数采用二分类常用的交叉熵损失,用于度量判别器上每个相应图像分块上真假分类的损失;模型优化采用Adam 优化器进行。在训练过程中,我们会随机抽取15%的数据集样本作为测试集(45 个),其余样本作为训练集(257 个)。模型会将所有的样本对学习一次,一个完整的周期称为一次迭代,为了让生成对抗网络进行充分学习。在参数设置方面,我们把epochs 设为2000,迭代优化次数设为2000 次。由于GAN 训练的不稳定性,初始学习率设置为较小的0.0002,在前600 次迭代保持初始学习率;在第600 次迭代后采用线性学习率衰减策略,每过100 个迭代学习率衰减为之前的0.1,优化器动量参数设置为0.5。迭代过程中算法会利用训练数据不断优化模型权重值,减少输出图像与真实图像之间的损失值,从而使生成图像越来越逼近真实图像。

模型测试:当模型训练完成后,在具有U-net架构的生成器中输入为带有用地形状和周边道路标注的图片,就能获得输出为相应地条件下的总平布局图,如图5 红框所示。

5 基于cGAN的Pix2Pix模型,包含生成器与判别器(绘制:梁凌宇)

2.4 实验测试

将训练集样本输入到训练好的模型中输出对应的测试样本,通过对测试输入(input)、测试输出(output)与真实样本(ground-truth)进行对比来分析检验模型的生成效果(表1)。从整体上看,虽然大部分的生成结果与真实样本并不完全一致,但主要出入口的选择、功能布局关系等基本都能符合小学校园的设计要求,均具有很好的总平布局设计合理性,部分生成结果甚至优于真实样本的设计,如No.301 生成的布局较原有布局更注重教学楼、运动场长轴方向的南北朝向布置,而真实样本与道路平行布置的方式并不能满足设计规范的要求;No.296 将校园主要出入口设置在次路上,相比真实样本来说能更好地避免学校主入口对城市交通的影响。可以说,经过训练的Pix2Pix 能够捕捉到用地条件与总平布局之间的映射关系,基本实现了预期的小学校园总平布局生成效果。下面主要从校园出口位置以及功能区关系等方面对45 个测试结果进行统计分析。

表1 训练集测试的部分生成结果(绘制:林文强)

2.4.1 校园主要出入口位置

中小学校园主要出入口应与市政道路相连,但要尽量避免设置在城市主干道上。首先统计生成结果与真实样本中主要出入口位置位于不同等级周围道路的占比情况(图6),再从建筑设计专业角度进一步分析生成结果整体布局是否合理(搜集样本时会删掉设计明显不合理的样本数据,因而统计结果是否合理时,将生成结果与真实样本的主入口一致的视为合理结果,表2)。结果表明,生成结果与真实样本完全一致的占53.4%,当有两条或以上的周围道路时,生成的主入口大部分位于次路,符合小学校园主入口与城市道路关系的一般设计需求。部分不一致的生成结果中有28.8%的测试结果属于虽不一致但合理甚至更好的情况。总体来看,82.2%的生成结果具有合理的主入口选择。

6 生成结果主入口位置的道路等级情况

表2 主入口选择结果综合评价(绘制:林文强)

2.4.2 教学楼与体育馆、体育场的布局关系

体育馆、体育场属于小学校园体育区部分,是学生进行体育教学、比赛及运动锻炼的主要场所,其与教学区的布局关系需要注意噪声控制方面要求。体育场与教学区的布局关系一般可以分为并列式、环绕式和复合式3 种模式,体育馆依据其规模大小与教学区可分为独立式、串联式和组合式3 种组织方式。

将生成结果的教学楼与体育馆、体育场的布局关系按上述模式进行统计(表3),可以发现有95.6%的生成结果中包含体育馆,其中91.2%是独立式布局,这既符合我们训练集样本中大部分体育馆的布局模式,也符合一般条件下小学校园的设计思维。全部生成结果都包含体育场,且体育场与教学楼都是并列式布局模式,最大限度地避免相互干扰。

表3 生成结果的教学楼与体育馆、体育场布局模式统计表(绘制:林文强)

2.4.3 教学楼朝向与体育场长轴方向

考虑到采光与日照的需要,中小学校的教学楼应尽量争取南北向布置,或南偏东一定角度。同时,由于地球磁场和太阳眩光等因素影响,《中小学建筑设计规范》也明确提出体育场长轴宜南北向布置,因此教学楼朝向和体育场长轴方向是否满足南北向布置也是小学布局设计合理性的一个重要评价因素。

通过统计 45 个生成结果、45 个真实样本以及257 个训练样本中教学楼朝向和体育馆长轴方向在0°~180°分布情况(表4、图7),可以发现,相较于真实案例和训练样本,生成结果中教学楼和体育场长轴是正南北朝向的占比更大,均超过80%,整体上优于真实案例和其他训练样本对设计规范中南北朝向的考虑,具有更好地合理性。

表4 教学楼朝向与体育场长轴方向分布情况统计(绘制:林文强)

7 教学楼朝向和体育场长轴方向分布概率图(6.7绘制:林文强)

2.4.4 教学楼的噪声间距

教学楼的噪声控制分为教学楼楼间噪声控制和教学楼与室外体育场噪声控制两个方面,规范要求间距控制均为不小于25m。样本库中教学楼均为单侧布房,统一总进深为11m,包括教室8m 和走廊3m,故只需教学楼间距不小于22m 即可满足噪声间距要求。教学楼与室外体育场间距核算方式为:当室外体育场在教学楼南侧时,室外体育场边缘与教学楼边缘最近的垂直距离不小于 22m,当室外体育场在教学楼北侧时,则该距离不小于25m(在一般的中小学设计中,对于单侧布房的教学楼,考虑到阳光直射的眩光问题,常将走廊布置在南侧,教室布置在北侧)。

所有 45 个生成结果的噪声间距统计结果见表5。生成结果中超过90%符合间距控制要求,其中教学楼楼间间距占比为 93.3%,教学楼与体育场间距占比为 95.6%,其中不符合要求的生成结果其间距计算值仅比22m 略小,原因可能在于数据标记过程中的细微误差以及样本压缩过后图片分辨率过小而导致的统计精度误差。总体来说,训练好地模型在教学楼噪声间距控制方面很好地掌握了设计规范的要求。

表5 生成结果噪声间距统计结果(绘制:林文强)

2.4.5 功能一致性

进一步对测试样本的生成结果与原始样本的功能要素组成是否一致进行统计与分析,原始样本具有的某功能要素在生成结果中也有的即视为一致,原始样本具有的某功能要素在生成结果中没有即视为不一致,统计结果详见表6。在45 个测试样本中,教学楼、走廊、体育场3 种功能的生成结果都达到了100%的一致性,体育馆的一致性达到93%,其中No.270 和No.273 未生成体育馆功能,No.275原始样本未包含体育馆,测试样本自己生成了体育馆功能,且与运动场相邻。报告厅功能的一致性为51%,其中No.293,No.295 等16 个测试结果未生成报告厅功能,No.296,No.301 等6 个真实样本没有而测试结果自己生成报告厅功能,且这些报告厅都与教学楼毗邻,布局关系具有一定的合理性。整体来看,体育馆和报告厅不一致样本中,生成结果的校园主要出入口位置大部分与原样本不一致,甚至选在了另一条道路上,部分样本更强调教学楼的南北向布局而非与道路平行,这些都导致生成结果功能布局与组成和真实样本有较大差异。此外,用作训练的302 个样本本身包含教学楼、连廊、体育场功能要素的样本占100%,含有体育馆功能的样本有265 个,占比87.7%,而含有独立报告厅功能的样本仅102 个,约占33.8%,也一定程度上影响了模型对于该功能的学习效果。

表6 功能要素一致性统计结果(绘制:邓巧明)

3 结论

本文从设计的逻辑思维过程与机器学习算法模型特点入手,以小学校园总平布局设计为研究对象,探讨利用对抗生成网络实现基于特定用地条件的校园总平布局生成设计的思路与方法。研究结果表明,依据建筑设计专业思维与任务特点构建生成对抗网络模型能够获得更好的总平布局生成效果。

与此同时,我们也看到,在将机器学习方法引入到建筑设计领域的探索中时,既要学习了解计算机领域各种机器学习算法模型的特点与适用领域,也要重视结合建筑学专业自身的特点。在模型构建阶段,需要充分结合专业设计特点与任务特点去选择合适的机器学习模型,构建具有建筑设计逻辑的输入与输出数据的映射变换,才能获得更好的生成效果。在评价训练后的模型效果时,同样不能简单按生成样本与真实样本的相似程度判断结果的好坏,建筑学专业评价有其特殊性,以总平布局为例,相同用地条件与功能需求往往有多个合理的布局设计模式,需要结合专业特点才能对生成结果得出更为全面客观的评价。

虽然本文构建的思路与方法只能面向特定的小学校园总平布局设计类型,且需要在训练数据库的构建中有较多人工,但从生成结果来看,绝大部分案例具有很好的总平布局合理性,甚至部分测试结果优于原有的真实样本,这让我们看到了基于数据驱动的机器学习方法在生成设计研究中的潜力和可能性。□

注释

1)实验设备硬件环境:CPU为Intel i7-8700K,GPU为NVIDIA GeForce GTX2080(显存6G)。实验代码采用Pix2pix,代码运行环境Python版本3.7,系统环境Ubuntu18.04,生成器采用U-net架构,判别器算法采用PatchGAN架构。

猜你喜欢

体育场教学楼布局
Two Funny Men
基于昆明高校教学楼采光质量的窗墙比优化研究
先进纤维材料战略布局
教学楼重建工程项目中的施工技术分析
教学楼重建工程项目中的施工技术分析
教学楼,作文本里的方格 组诗
基于遗传算法的教学楼智能照明控制系统设计
他只做有“思享”的讲座,让小小微信装下一个“万人体育场”
Face++:布局刷脸生态
Lumileds汽车照明:新布局下的新思路