当前位置:首页区块链openai的另一部“大片”:赋予AI艺术创造力

openai的另一部“大片”:赋予AI艺术创造力

openai的另一部“大片”:赋予AI艺术创造力

面对无限可能,我们只需要充满期待。

Openai又推出了一部大片。

本月初,去年夏天推出流行语言模gpt-3的openai研究小组再次宣布推出一款名为dall-e的新人工智能模,虽然没有gpt-3那么火爆,但它很可能对人工智能未来的发展产生更深远的影响。

总之,dall-e可以将文本描述作为输入,生成相应的原始图像输出。(dall-e这个名字来源于对超现实主义艺术家El Dali和皮克斯工作室创作的可爱机器人形象Wall-e的致敬。)

例如,当您输入“五边形绿色时钟”、“火球”或“建筑物墙上的蓝色南瓜壁画”时,dall-e可以产生惊人准确的视觉效果。

在需要生成“建筑墙上的蓝色南瓜壁画”后,openai的新深度学习模dall-e可以生成上述原始图像

为什么dall-e很重要?

首先,它标志着一种新的人工智能范式“多模态人工智能”的出现。这种范式似乎代表了人工智能的未来。以dall-e为例,多模式人工智能系统能够解释、综合和翻译多种信息模式,从而映射情境、语言和图像。虽然dall-e不是第一个多模人工智能解决方案,但它具有迄今为止最惊人的实际效果。

openai的联合创始人伊利亚•萨茨凯总结道:“世界不仅仅是由文字组成的。除了表达,人类还诉诸于视觉。视觉元素非常重要。”

大多数现有的人工智能系统只能处理一种数据类。自然语言处理模(NLP模,如gpt-3)只能处理文本;计算机视觉模(如人脸识别系统)只能处理图像。但人脑所表现出的智力显然更具适应性,它所能处理的信息也更具灵活性。

人类可以不断地接收和整合来自五种感官的信息——我们通过视觉、听觉、触觉、嗅觉和味觉的结合来了解我们周围的世界。在此基础上,我们还以声音、文字、身体表情、面部表情、音乐等形式将信息传回这个五彩缤纷的世界。

通过将自然语言理解与视觉表征生成相结合(即“阅读”与“视觉”相结合),dall-e再次展示了多模态人工智能的巨大潜力。

这只是个开始。在未来几个月甚至几年,新的人工智能系统有望无缝连接音频、视频、语音、图像、文字、触摸和其他元素。随着人工智能学会以越来越复杂的方式组合多种信息,其理解世界和产生新见解的能力将爆炸式增长。

dall-e还有另一个,或者说更根本的意义:人类越来越无法否认人工智能所蕴含的巨大创造力。

dall-e所产生的图像远远超出了人类的想象范围。这不仅仅是对互联网上现成图片的简单修改——相反,这些都是史无前例的渲染,其中的独创性和独创性足以让艺术家赞叹。事实上,即使是dall-e的创造者也常常不能理解它的生成原理。

让我们来看看戴尔的一些作品。第一个是“一碗拉面表情”,第二个是“鳄梨企鹅”。如果这些成就来自人类设计师,我们无疑会把它们视为真正的创意产品。在这种情况下,我们有什么理由否认或拒绝dall-e?

openai的另一部“大片”:赋予AI艺术创造力1

dall-e根据“一碗拉面”输出的图像

openai的另一部“大片”:赋予AI艺术创造力2

图片
由dall-e从“鳄梨做成的企鹅”生成

有了这种强大的创造力,dall-e可以证明人工智能技术在产品设计、时尚、建筑等领域的现实意义。比如达赖系统,甚至是设计人员的灵感来源。

例如,在设计“甜甜圈式扶手椅”时,dall-e带来了多种构图选择。当然,它的设计和外观都是高标准的。不难想象,未来一些家具设计师会反复使用dall-e来探索模输出,调整输入文本进行设计迭代,最后将人工智能元素引入作品。从汽车到灯具,从珠宝到房屋,类似的创作过程将适用于许多产品。

openai的另一部“大片”:赋予AI艺术创造力3

dall-e根据“甜甜圈式扶手椅”生成的输出图像

当然,dall-e还远远不够完美,它生成的图像并不总是准确地表示输入的文本:例如,它经常在颜色、数量或空间关系上出错。

利用clip神经网络对openai发布的All-E工作实例进行分类筛选。对于每个文本输入,系统将只显示512个样本中置信度最高的前32个样本。换句话说,dall-e实际上生成了更多的图像,但大多数图像效果不好。

总而言之,dall-e的创造力是惊人的,技术本身仍处于快速迭代中。

与人工智能技术的其他重大发展一样,dall-e再次提醒我们一个老问题:机器的智能水平是否越来越接近人类?

一方面,dall-e的诞生激发了人们对超智能技术的夸大言论。另一方面,以著名的深度学习批评家加里·马库斯(Gary Marcus)为代表的怀疑论者认为,dall-e并没有给人工智能技术的发展带来任何真正的动力。

马库斯的观点值得认真对待。深度学习(包括为DALE E和GPT-3提供基础的前沿变压器体系结构)在智能概念建模中仍然存在严重的局限性。

但在某种意义上,这场争论实际上偏离了真正的观点。无论openai的新模式是否代表着迈向“通用人工智能”的下一步,无论深度学习能否真正带来与人类认知水平相同的机器智能成果,dall-e本身仍然拥有非同寻常的新能力已成为不争的事实。

DALE E及其后续项目有望为人与机器之间的创造性关系带来新的可能性,从而获得巨大的经济价值,为新一轮创新初创企业和产品奠定基础。

面对无限可能,我们只需要充满期待。

温馨提示:

文章标题:openai的另一部“大片”:赋予AI艺术创造力

文章链接:https://www.btchangqing.cn/182188.html

更新时间:2021年01月20日

本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。

openai的另一部“大片”:赋予AI艺术创造力4
区块链

金色前哨 | 耶伦在听证会这么谈加密货币、经济刺激和美元贬值

2021-1-20 17:37:00

区块链数字货币

以太坊2.0时间确定,山寨有望?比特币来到关键位置何时入场?11月5日老俞区块链

2021-1-20 17:55:09

7 条回复 A文章作者 M管理员
  1. 无心

    该埋伏的早都埋伏完了,现在冲就是韭菜。

  2. BCVoice

    合规溢价权

  3. 周裕强

    这两天开始阴跌了,再出个利空,暴跌,等着吧

  4. 九零大侠

    熊二而已,熊三还没出现。现在看多要做好多次腰斩的准备

  5. 那点事

    比特币勤奋真能造就财富吗?比特币

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索