新浪(làng)科技讯 1月6日上午消(xiāo)息,据报(bào)道,旧金山人工智(zhì)能研究公司OpenAI已经开(kāi)发了一种新系统,能根据短文本来生成图像。
OpenAI在官方博客中表示,这个新(xīn)系(xì)统名为DALL-E,名称来源于艺术家萨尔瓦多·达利(Salvador Dali)和皮克斯的机器人英雄(xióng)瓦力(WALL-E)的结合。新系统(tǒng)展示了(le)“为一系列(liè)广泛的概念(niàn)”创造图像的能力,创作的作品包括牛油果形状的(de)扶手椅等。
通过(guò)神经(jīng)网络去(qù)生成图像,这种技术(shù)并不新颖(yǐng)。此前(qián),生(shēng)成对(duì)抗网络(luò)(GAN)已被广泛用于创(chuàng)建真实的(de)人、宠物、租(zū)赁房产和食物的照片。
不过(guò),DALL-E的独特之(zhī)处在于可以根据输(shū)入的文本来创(chuàng)作图像。该系统(tǒng)基(jī)于文字生成系统GPT-3的一个版本,该(gāi)系(xì)统此前被用于撰写诗(shī)歌和新闻文章等。利用配对好的(de)文(wén)本和图像数据集进行(háng)训练,DALL-E可以根据新的文字提示生成图像,此(cǐ)外还展示了创造多种风(fēng)格图片的能(néng)力。
OpenAI还发布了图(tú)像(xiàng)识别系统Clip。Clip通用(yòng)性比当前针对单个任(rèn)务(wù)的系统更好,可以用网上公开的文字图像配(pèi)对数(shù)据集(jí)来训(xùn)练(liàn)。
DALL-E还需(xū)要继续优化。OpenAI指出,DALL-E目前的可靠性还存在问(wèn)题,对类(lèi)似“glass”等有多个含义的名(míng)词常常会(huì)混淆,文字中不同(tóng)的语法也可能(néng)会造成不同的结果(guǒ)。
此外(wài)还有更(gèng)深层次的问题需要解决。OpenAI表示:“我们注意到,涉及生成模型的工作可能(néng)会(huì)产生重大而(ér)广泛的社会影响。”未来可能的(de)举措包括研究对就业岗(gǎng)位的影响,生成结(jié)果的偏见(jiàn),以(yǐ)及技术的长期道德挑战。
长期以来,公众一直担心人(rén)工智能生成的媒体内容被滥用,例如神经网络被(bèi)用来制造(zào)虚假的音视频和(hé)图像,用于(yú)不(bú)道德的(de)目的,例如政治(zhì)上的假信息和欺诈活动等。