建筑和人工智能
今天,我们将开始讨论人工智能及其与建筑实践和建筑学生教育的交叉。这是一个艰巨的任务,但我们必须从某个地方开始。安德鲁和我都在探索像 ChatGPT 这样的平台,以及像 MidJourney、DALL-E 等图像生成器。关于这方面的信息实在太多了,我们觉得应该邀请一位嘉宾参加今天的节目,以帮助促进我们的讨论。
介绍
Kory Bieg 是德克萨斯大学奥斯汀分校的建筑副教授。他获得哥伦比亚大学的建筑硕士学位,华盛顿大学圣路易斯分校的建筑学学士学位,并且拥有 NCARB 认证,是得克萨斯州注册建筑师。
2005 年,Kory Bieg 创立了 OTA+,一个专注于利用当前、新兴和新兴数字技术进行建筑设计和制造的建筑、设计和研究机构。OTA+ 使用当前的设计软件和数控机床来生成和构建在概念上严谨且形式独特的设计提案。
自 2013 年以来,他担任德克萨斯州建筑师协会 Emerging Design + Technology 会议的主席,并担任 TEX-FAB 数字制造联盟的联合主任。他曾任 SXSW Eco Place by Design 和计算机辅助设计建筑协会(ACADIA)的董事会成员。
人工智能 101
Kory 为我们提供了人工智能的一个非常简要的历史。最初,目标是使机器/计算机像人类一样思考。图灵测试(于 1950 年发明)旨在测试机器“欺骗”人类的能力。目标是,如果与机器进行互动的人不知道他们正在与机器互动,那么机器就通过了图灵测试。最初它被称为“模仿游戏”。这是在机器学习的主要目标是使机器像人类一样思考和行为的时代开发的。然而,近年来,我们意识到这实际上是不可能的。我们已经将目标转向让机器像机器一样思考,但训练它们做它们比人类更擅长的事情,比如分析大量数据、运行复杂算法等等。Kory 所见到的第一张图像之一是 Matias del Campo(他的 Instagram 账号)的作品,其中是一座由羽毛制成的房屋。
有几种机器学习模型,它们从特定的数据集中进行机器学习。提供给机器的信息就是它所学习的唯一信息。例如,自动驾驶汽车的人工智能机器只会被提供与驾驶相关的数据集,如道路状况、地图、交通法规、驾驶场景等。在这种情况下,它们可以学习非常特定的数据集,然后解决与这些数据集相关的复杂问题或创建的问题。
目前最新版本的数据爬取现在是基于融合的人工智能。这些是文本到图像类型的人工智能平台。它会从互联网来源中获取数据/图像,这些数据/图像开始形成一个包含随机像素信息的噪声云。它不是通过拼贴,也不是将找到的图像拼接在一起,而是逐像素地组装信息,创造全新的图像。这些基于文本的图像是由用户输入的“提示”创建的,该提示作为图像生成的描述符。因此,人工智能开始根据输入的描述提示来创建图像。目前有许多这样的平台,因为它们刚刚出现在舞台上。时间将告诉我们哪些平台能够存活下来。您可以将其看作是几年前社交媒体平台的起步阶段。
提示是影响所创建图像的主要因素。但随着这些平台的发展,Kory 发现更重要的是对从一个原始提示产生的图像的迭代进行策划。这些图像可以进行重新混合和迭代,然后进入另一个人工智能平台进行继续和完善。因此,可以使用某种工作流程来制作 Kory 所生成的最终人工智能图像。一个非常简短的提示可能会提供与一个非常长且描述性的提示一样复杂而精彩的图像。
人们应该关注哪些平台呢?
目前,MidJourney 可能是最知名的平台之一。但是,有几个平台可能对建筑师和设计师来说最“有用”。再次强调,当前市场上有很多这样的平台。但其中一些对于我们作为建筑师和设计师来说似乎更加突出。其中一个是MidJourney,它使用了一个 Discord 频道,是图像生成的前沿平台。这个平台在生成图像时更有创意,甚至可以调整创造性的程度。
另一个是由 OpenAI 创建的 Dall-E,目前已经推出了第二个版本 Dall-E 2。它更直接地解释提示文本,以创建和输入图像。因此,它可能不会生成像 MidJourney 那样创意上更为自由的图像。
Stable Diffusion(Dream Studio)是另一个更直接地解释用户的文本提示的平台。然而,它仍然可以用来制作特定的图像。它还有一些“子组件”,例如 Control Net。这种人工智能可以以一种准确的方法混合或结合两个图片,然后以多种方式进行修饰。这更像是一种直接的图像到图像的布局转换。例如,在新生成的 AI 图像中,源图像中的特定姿势保持完全相同。
Hugging Face 是一个包含各种类型的人工智能修改和脚本的开放平台。它可能更加先进,但可以执行一些非常具体的任务。例如,它有一个脚本,妳可以插入一个由 AI 生成的图像,它将给出 AI 用来创建该图像的提示。这可能会产生一些奇特的文本提示结果,但 Kory 已经用它们来分析自己的作品,而这些提示效果非常好。在一个例子中,他的建筑图像引用了席琳娜·戈梅茲或得克萨斯革命等事物。
ChatGPT 是一个基于文本的人工智能,官方上它是一个人工智能聊天机器人。它使用整个互联网作为数据集,并主要提供文本。这个平台在各个领域都产生了很大的影响。虽然上面的平台主要用于创意图像的生成,但 ChatGPT 生成的文本可以在任何情况下使用。它可以撰写报告、编辑文本、编写代码、解决数学问题、创建广告文案、起草某个主题的参考文献等等。在过去的几个月中,它已经在生活的许多领域中出现。它于 2022 年 11 月 30 日发布,并最近发布了 ChatGPT 4。因此,这些平台都在快速更新,不断增强其功能。
对教育过程的影响
这些平台将对未来建筑师的教育产生明确的影响。Kory 正在将文本到图像平台用作草图工具。最近,他让学生使用 Hugging Face 让人工智能阅读前例图像,以分析现有作品。他们利用人工智能来观察形体、流线以及其他典型元素和图像的描述。学生们利用这些反馈信息来创造自己的想法,并运用人工智能的数据。这使他们能够以一种新的和具体的方式理解建筑师的作品,然后将这些信息应用于生成自己的想法。然后,他们试图从人工智能转向使用 Rhino 和 Grasshopper 等当前软件以更传统的方式创建图像。这并非易事,因为人工智能的图像在其二维创作中非常丰富、复杂和细致。
Kory 认为,在一年左右的时间内,这些平台将从二维图像发展为三维输出。这在某种程度上令人担忧,但也令人兴奋。这可能会使迭代过程更具互动性,并允许设计师将其置于基于优化的分析、采光模型或生成模型中。这将使我们作为建筑师能够在真实环境中分析这些作品。目前,它们完全没有上下文。将这些作品导出到真实环境中将对该行业产生颠覆性影响。这将改变我们作为建筑师和设计师工作的方式,并影响我们的工作流程。我们的工作流程将以一些新的有趣方式受到影响。
ChatGPT 也在颠覆教育系统。这个基于文本的平台对教育系统的影响不仅仅局限于建筑领域。它可以做一些有趣的事情,让许多学术界人士对其对教育的影响方式非常担忧。目前,大多数学术界正在努力寻找管理这个平台的方法。但这个平台存在一个重要问题,它是使用互联网作为数据集,而并非互联网上的所有内容都是真实或准确的。因此,它提供的回答可能是错误的。有几个例子显示,ChatGPT 提供了一些不存在的引用参考。
这些新的 AI 平台存在两个主要问题,其中一个是它们使用互联网作为数据集。首先是上面提到的问题,即互联网上的所有信息并非都准确或正确。第二个问题是数据集在 AI 或数据集提供者内部的“标记”方式。这给许多行业或用户带来了问题,因为同一项内容可能有许多不同的标识符。例如,建筑师通常用其他名称来称呼门和窗户,如开口或孔径,但 AI 并不将其识别为该标签。因此,许多特定的标识符在当前系统中没有得到充分表示。此外,数据集提供者在标记数据时可能存在某种偏见。这就涉及到人类偏见的问题。
我们的对话在这一点上开始涉及到了一些复杂的问题。我们讨论了提示的特征。Kory 强调了迭代比实际提示更重要的观点。但是提示的使用也在发生变化。我们还谈到了将图像转化为实际项目的问题。当AI生成三维模型时,这将如何改变?虽然这可能还需要一些时间,但它正在迅速发展。我们讨论了利用互联网作为这些平台数据集的影响和结果。在互联网上拥有更多“带宽”的人在 AI 的回应中可能更加丰富。然而,这并不总是会产生最好的结果,因为在网络上的丰富并不总是等同于优秀。
人工智能的未来及其与建筑师的关系
迄今为止,大部分建筑都基于我们对其进行记录的能力。随着技术的发展,这种情况将开始发生变化。将这些更加“奇幻”的概念转化为三维模型将改变建筑设计的工作流程。虽然这可能需要更长的时间才能实现,但这是一个明确的可能性。
Kory 认为这可能会有两种发展路径。我们在过去的几个实例中已经经历过类似的不稳定、恐惧和兴奋的情绪。当计算机、虚拟现实和草图工具被引入时,这种扰动并没有如最初预期的那样大规模地影响这个行业。尽管它们产生了影响,但并没有完全改变这个行业。因此,这些人工智能元素可能不会以如此巨大的方式发展。它们可能会在各自平行的路径上发展。另一种可能性是它们最终会在某个时刻汇聚在一起,从而对这个行业产生重大变革。但目前我们对这种新的人工智能技术的发展方式一无所知。
目前,人们正在积极探索这将如何影响这个行业的未来。目前,这一切都处于实验阶段,还处于初级阶段。它将如何继续发展是一个未知数。它可能使我们能够使用人工智能替代一些更为琐碎的工作,例如细节设计、施工文件、规格说明等等。人工智能能否取代设计过程中的这些部分,并让建筑师能够专注于设计、性能和设计过程的更多定性部分?
对于每个人来说,最大的问题是它将如何发展。它将毫无疑问地不断发展。Kory 希望从乐观的角度看待这一切。它可能在很多方面让我们变得更好。这些机器平台永远无法完全取代我们。它们不是人类。它们能做得比人类更好的事情,但也有一些事情它们永远无法像人类那样做得那么好。因此,我们应该对所有这些新技术持积极的态度。所有这些新技术对这个行业和教育体系都有着许多可能性。Kory 认为,最好的发展方式是拥抱它,并让它为你所用。
建筑与人工智能
人工智能已经出现并将继续发展。不要害怕去探索。妳付出的越多,获得的回报就越多。Kory 非常支持这种对话。这是一个持续学习的过程,作为建筑师,我们应该一直在学习。这是过程的一部分。它可以被强制加入并按照已有的框架运行,或者你可以在早期阶段探索它,并允许它为妳完成妳想要的工作。它永远不会取代我们作为人类在设计过程中的能力,但似乎它肯定会改变我们未来的设计过程。
附注:有时从提示生成的图像完全没有意义...查看这些图像并阅读说明以了解生成它们所输入的内容...
【製作團隊】
企劃:了有和
腳本:了有和
翻譯:了有和
排版:了有和
校對:了有和、游客
監製:了有和、Beatrice
版权声明:未经授权,不得转发。
原文链接:https://www.lifeofanarchitect.com/ep-122-architecture-and-artificial-intelligence/