人工智能艺术(AI艺术)是指任何通过人工智能工具创建或增强的艺术形式。尽管通常与视觉艺术(如图像或视频)相关,但“AI艺术”一词也适用于音乐、写作和其他创作形式。
创建AI艺术的工具使用经过数字化艺术作品数据及其相关描述数据训练的机器学习算法。这使得算法能够学习什么是艺术以及如何描述艺术。AI艺术工具还利用其他先进技术,如神经网络和生成对抗网络(GAN)。这些技术共同使得根据提交的文本提示改变或增强现有图像,或生成新图像成为可能。
AI艺术挑战了人类作为艺术唯一创造者的千年范式。它的出现引发了关于创造力起源的问题,并带来了伦理和法律上的担忧。AI艺术还提供了多种扩展艺术和创造力边界的机会。
AI艺术几乎可以让任何人以比其他方法少得多的时间创建数字艺术。此外,AI艺术可以生成视觉或音频作品,这些作品在其他情况下可能难以创作。通过图像生成的AI工具,如Dall-E或Stable Diffusion,用户只需输入(或说出)描述性文本提示,工具便会生成所需的图像。
本文是
什么是生成性AI?生成性AI的解释
- 还包括:
- 2024年8大生成性AI工具类别
- AI会取代工作吗?17种可能受影响的职业类型
- 2024年19个最佳大型语言模型
AI艺术是如何工作的?
AI艺术工具使用多种模型和技术生成图像,尽管大多数基于相同的基础技术。例如,AI艺术工具广泛使用机器学习算法来揭示收集数据中的复杂模式。一个算法会接收所需的数据来训练AI模型,从而生成准确且逼真的图像。数据本身是一个包含大量数字图像及其描述信息的集合。
一旦模型被训练,用户可以向AI平台提交文本提示。该提示会被纳入生成过程中,以确保准确性和相关性。现代AI艺术工具,如ChatGPT和Microsoft Copilot,提供了一个界面,使用户能够轻松将文本提示直接提交给平台。然而,提示必须仔细描述要生成的图像类型。提示越精确,生成的图像质量越好。为了支持这一过程,AI工具通常使用某种形式的自然语言处理(NLP)来理解和解释提示。
AI艺术平台使用不同类型的模型,包括以下几种:
- 生成对抗网络。GAN使用深度学习和多个神经网络生成与训练数据相似的图像,同时考虑用户的提示。
- 卷积神经网络。使用CNN方法,深度学习模型识别对象,然后可以用于生成新图像。
- 神经风格迁移。NST与CNN结合使用,是一种深度学习技术,能够将一种图像的风格转移到另一种图像上。例如,用户可能会使用NST生成一幅梵高风格的图像。
- 递归神经网络。RNN生成数据序列,例如用于音乐的序列。RNN使用反馈循环,根据先前的输入生成一系列输出。这使得RNN能够生成与其训练输入相似的新输出。
制作AI艺术有多难?
制作AI艺术对所有类型的创作者来说变得越来越简单,无论他们的技能水平或对AI工具的经验如何。
在最先进的层面上,艺术家可以根据他们想要创作的艺术类型训练自己的AI模型。在这种方法中,艺术家首先需要收集或访问包含数字化艺术作品及其描述的数据集。一旦数据收集完成,艺术家可以使用适合生成艺术的模型(如GAN)来训练AI模型。
艺术家也可以使用现在可用的多种AI艺术工具,而不是自己训练AI模型。这些工具易于使用,因为模型已经在现有艺术的数据集上进行过训练。根据工具的不同,艺术家可能能够添加自己的图像集,以进一步优化模型。
经过训练后,艺术家可以通过向AI平台提交文本提示来生成图像。一些平台允许用户通过在同一会话中提交后续提示来进一步优化他们的图像。平台还可能为艺术家提供视觉设计工具,以微调他们的创作。
可用于创作艺术的AI图像生成工具有多种,包括:
- Adobe Firefly。
- Artbreeder。
- Dall-E。
- Deep Dream Generator。
- DreamStudio。
- Midjourney。
- Playform。
- Stable Diffusion。
许多AI艺术工具为新用户提供免费积分或免费试用,以便他们进行尝试。其他服务,如ChatGPT和Copilot,提供一个免费的层级,允许在有限范围内生成图像。
艺术家如何使用AI?
过去,艺术家的主要工具是画笔、颜料、凿子、打字机、乐器或其他物理设备。AI艺术为创作艺术提供了一种新工具,能够惠及多种使用场景:
- 艺术疗法。许多人创作艺术以获得个人享受和放松。治疗师也可以使用AI艺术进行职业治疗和其他类型的治疗。
- 教育。教育工作者和教师可以使用AI艺术工具帮助培养新一代艺术家。AI艺术还可以用于生成用于课堂的图像,以帮助解释复杂概念。
- 艺术创作。AI工具帮助艺术家创作全新的视觉艺术、视频和音乐。
- 艺术增强。艺术家可以使用AI工具增强、增强和改善他们的创作。
- 艺术灵感。AI工具为艺术家提供起点,可以提供新的视角,激发创新,并激发新的想法或风格。
这些图像代表了AI和AI生成图像的多样性。
为什么AI艺术有争议?
AI艺术平台为艺术家提供了多种创作艺术的机会。然而,AI艺术也带来了许多担忧:
- 著作权。艺术家长期以来享受在其艺术作品上签名的实践。但在AI艺术中,著作权是如何运作的?一个新兴的伦理问题是,究竟是谁创造了这件作品:AI平台、用于训练数据的源艺术作品背后的艺术家,还是提交提示的用户?
- 偏见。AI模型的多样性和代表性仅与其训练的数据有关。如果数据本身对某一特定人群有偏见,则生成的图像中可能会出现这种偏见。
- 版权。一个主要的担忧是潜在的知识产权盗窃。例如,一些大型基于GAN的AI平台在训练模型时使用了受版权保护的数据,导致多起诉讼。例如,Getty Images在2023年1月对Stable Diffusion提起诉讼,指控其侵犯了Getty所持有的版权。
- 原创性。尽管定义什么构成艺术长期以来一直是争论的主题,但一个共同特征是艺术在某种程度上是原创的。对于AI艺术来说,存在一个伦理问题,即生成的作品是否真的是原创,还是只是衍生的。
AI生成艺术的历史
AI艺术的早期尝试之一是1973年推出的Aaron系统。该系统由哈罗德·科恩开发,是一个使用符号AI方法创建黑白艺术画作的AI助手。然而,直到2014年GAN首次被引入,AI生成艺术才真正开始取得进展。GAN还为生成性AI技术提供了基础。
2015年,谷歌发布了DeepDream,作为一种实验性AI艺术方法,使用卷积神经网络,进一步推动了该领域的发展。三年后,2018年,Ganbreeder推出,后来更名为Artbreeder。它结合了GAN模型,使人类能够使用AI修改现有图像并创建新图像。
同年,Obvious艺术家集体使用GAM模型创作了一幅名为《Edmond de Belamy》的画作。这些GAN模型在从14世纪到19世纪的15,000幅肖像画的语料库上进行了训练。这幅艺术作品在WikiArt网站上公开可用。该集体最终在佳士得拍卖行以432,500美元的价格出售了这幅画。
2021年1月,OpenAI推出了Dall-E,这是第一个主要的基于GAN的文本到图像生成工具。Dall-E提供了一个公开可访问和可用的系统,使任何有互联网访问的人都可以使用文本提示创建AI艺术,向世界展示了AI艺术的潜力。
这幅Dall-E图像是根据用户的文本提示生成的。
2022年5月,谷歌宣布其Imagen文本到图像技术,作为AI艺术的另一种选择。随后在2022年8月,Stability AI推出了Stable Diffusion服务,这是另一个基于GAN的、公众可访问的文本提示生成AI艺术的工具。
2023年,AI艺术工具的增长持续,许多大型软件供应商加入市场。其中一个显著的例子是Adobe Firefly服务,于2023年3月宣布。Adobe将基于GAN的方法整合到其流行的图像和视频编辑工具中,包括Photoshop和Premiere。
探索AI生成内容的优缺点,AI内容生成器以及AI和机器学习趋势。了解为什么创意工作者表示生计受到生成性AI的威胁,以及AI将如何影响内容营销的未来。
最后更新时间为2024年11月