作者 | 林小白
12月16日,Science发布2022年度科学十大突破,它们是一年里最重大的科学发现、科学进展和趋势,其中AIGC作为人工智能领域的重要突破也赫然在列。
AIGC即是指利用人工智能技术生成内容。
作为今年AI圈最大的趋势,AIGC意味着,AI进军到了此前被视为“人类独占”的领域,如艺术表达、科学发现。Science表示,最初AI这种渗透是缓慢的,但在今年逐渐形成了一场抢地战。
在李彦宏看来,未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。
但与此同时,AIGC目前面临的版权与伦理、商业化变现等难题,正在为AIGC未来发展的埋下隐患。
火爆的AIGC
2022年被称为是AIGC元年。
事实上,今年AIGC的第一次出圈还要从一副获奖的AI绘画作品说起。
今年8月,在美国科罗拉多州举办的数字艺术家竞赛中,一幅名为《太空歌剧院》的画作最终获得数字艺术类别冠军。
画面上,几位演员穿着华美戏服,站在舞台上表演,黑暗中的观众席上方出现一个巨大圆窗,似乎能看到另一个未知世界的存在。
但这一绝美的画作并没有让艺术家们心服口服,反而引起巨大的争议。原因在于这副获得头奖的作品并非由作者Jason Allen亲自使用画笔绘成,而是使用人工智慧(AI)算法绘图工具Midjourney完成。
有人认为,Allen使用AI生成图像完全是在作弊,“这太恶心了,通过AI生成一幅画就声称自己是艺术家?”还有网友说:“这真的很糟糕,试想一下如果机器人去参加奥运会。”也有人不满Allen把AI生成的图像与艺术品混为一谈,表示“我们正在目睹艺术死亡。”
关于这一话题的争议在世界范围内迅速发酵,国内话题“AI画作拿一等奖惹怒人类艺术家”也很快登上热搜,仅单日阅读量便已超过1.1亿次。
而在该事件发生的两个月后,ChatGPT的火热再次让人们的目光聚焦到AIGC上。
11月30日,明星人工智能公司OpenAI发布全新聊天机器人模型ChatGPT,并对用户开放免费使用。
体验过的用户无一不被ChatGPT强大的功能折服,它不仅可以轻松与人类进行各个领域的对话,回答各种问题,无论是写代码改bug、回答科学问题,甚至给推特的发展提建议机承认自己的错误、质疑不正确的假设,拒绝不合理的要求等。
图源小红书
聪明且智能的ChatGPT很快走红网络,仅上线短短5天其用户数量就突破百万。而由于太过火爆,OpenAI不得不暂时关闭了用户的测试入驻窗口。
面对功能强大的ChatGPT,有业内人士指出ChatGPT的出现会对传统的搜索引擎造成冲击。OpenAI 的联合创始人马斯克在体验后也感叹:“ChatGPT 非常好。我们离强大到危险的AI不远了。”
火热的AIGC赛道同样受到了资本青睐,今年来AI智能初创公司融资不断。
10月19日,主打文字生成的AIGC公司Jasper.ai宣布完成1.25亿美元的A轮融资,估值达到15亿美元。几乎同一时间,Stability AI宣布获得1.01亿美元,公司宣布会继续研发用于生成图片、语言、音频、视频和3D的AI生成模型,投后估值达10亿美元。
国内AIGC技术服务提供商慧夜科技也于近期完成由高瓴创投领投、顺为资本跟投的Pre-A+轮数千万融资。
与此同时,国内外互联网巨头争先布局AIGC领域。
目前在国内,腾讯发布了写稿机器人Dreamwriter,阿里巴巴旗下AI在线设计平台鹿班实现海报设计生产,字节跳动旗下的剪映和快手推出的云剪能够进行AI视频创作。今年8月,百度发布AI艺术和创意辅助平台“文心·一格”,可快速生成AI画作。
在海外,谷歌、Meta、微软等科技公司也不断推动从文字、图画走向视频的AIGC创新迭代。
资本涌入、互联网巨头纷纷布局的背后是AIGC巨大的经济价值和市场规模。
根据《Generative AI:A Creative New World》的分析,AIGC有潜力产生数万亿美元的经济价值。而国泰君安表示,未来五年或将有10%-30%的图片内容由AI参与生成,相应或将有600亿以上的市场规模。
为什么突然火了?
从字面来看,AIGC并不难理解。
AIGC全称为AI Generated Content,对应互联网的PGC(专业生产内容)、UGC(用户生成内容)、PUGC(专业用户生成内容)等概念,AIGC是通过 AI 技术来自动或辅助生成内容。
事实上,AIGC也并非是近几年才出现的新概念。根据中国信通院发表的《人工智能生成内容(AIGC)白皮书》,AIGC的发展从受限于技术发展的早期概念阶段,经过1990年之后的沉淀积累阶段,自2010年至今正处于快速发展阶段。
而AIGC之所以在今年迎来爆发,和深度学习模型不断完善、开源模式的推动密切相关。
此前中国信通院的研究发现指出,深度神经网络的升级是推动AIGC快速发展的主要原因之一。
特别是从2014年生成式对抗网络(GAN)的提出,被业内认为AIGC真正迎来了“春天”。GAN通过AI内部生成、判别两套模型进行迭代训练,能够实现根据输入的信息生成新图像。
但GAN也有着明显的缺点,由于GAN需要用判别器来判断生产的图像是否与其他图像属于同一类别,这就导致生成的图像是对现有作品的模仿,而非创新。因此依托GAN模型难以创作出新图像,也不能通过文字提示生成新图像。
这一缺点被今年出现的去躁扩散模型Diffusion所克服。
Diffusion扩散化模型的原理类似给照片去噪点,通过学习给一张图片去噪的过程来理解有意义的图像是如何生成,因此Diffusion 模型生成的图片相比 GAN 模型精度更高,更符合人类视觉和审美逻辑,同时随着样本数量和深度学习时长的累积,Diffusion模型展现出对艺术表达风格较好的模仿能力。
Diffusion扩散模型使得文本生成图像的AIGC应用真正被大众所熟知,也是2022年涌现的各类AI作画应用的重要模型基础。
2021年年初,OpenAI发布了用于匹配文本和图像的神经网络模型CLIP,被认为是近年来在多模态研究领域的杰出成果,它不仅能对文字进行语言分析,还能对图形进行视觉分析,不断调整两个模型内部参数,达到文字和图像高度匹配的效果。
可以说,Diffusion+ CLIP的结合让AI自动生成文字和图片的质量得到了质的提升,也是推动 AIGC爆火的重要原因。
在这一过程中,开源模式也进一步促进AIGC的传播和普及。
据光源资本,开源即开放源代码,任何人可以在源代码的基础上进行学习与修改。比如2022年初,Disco Diffusion的开源引发了开发者对文生图领域的探索和创作,而2022年下半年Stable Diffusion的火爆除了因为Diffusion模型的创新,也是因为形成了良好的开源社区氛围,以开源的方式缩短了行业技术进步所需要的时间。
Stable Diffusion模型开源后短短几个月时间出现大量的二次开发,从模型本身优化到应用拓展以及插件,大量开发者和用户进行传播和创作,也直接引发了2022年AIGC的火爆。
此外,大量内容需求也在牵引AIGC应用落地。
国盛证券认为,迈入Web3.0时代,内容消费需求飞速增长,UGC/PGC难以匹配扩张需求,AIGC将是新的元宇宙内容生成解决方案。
亟需解决的版权问题
AIGC将带来内容生产变革的消息让人激动不已,但由于AIGC发展尚处于初期,关于AIGC的版权和商业化落地等问题亟需解决。
AIGC作品实际上是AI在被投喂了大量人类创作的素材后,通过不断学习,生成一个庞大的数据库,然后根据用户需求进行创作。
这就导致AI生成的作品在风格和细节上和原作品或存在诸多相似点。此前中国新闻周刊文章提到艺术家对AI作画的抗议。文章称,以油画风格的恢弘奇幻作品闻名的波兰概念艺术家格雷格·鲁特科夫斯基成了Stable Diffusion中最受欢迎的模仿对象之一。他在网上搜自己的名字,蹦出的都是AI的画,自己的作品已经被淹没了。
在《太空歌剧院》意外获奖后,大批画师已将“禁止投放作品进入AI绘画系统”加入个人简介,全球知名视觉艺术网站ArtStation的上千名画师发起联合抵制,禁止用户将其画作投放AI绘画系统,ArtStation认为,任由系统学习模仿画作是在侵犯版权。
11月29日,插画博主洛柒投诉AI绘画的微博也引发热议。洛柒指出,AI绘画软件Nijijourney生成的许多图片风格,与一些画师的作品高度相似,更有一些图片下方直接带上了这些画师的签名和水印,“(AI作品)有很多我熟悉的老师的画作”“求求各位老师对AI重视起来”,洛柒呼吁道。
但事实上,目前对于AI绘画对其他画师的著作权构成侵权,认定依旧困难。为规避版权风险,Getty Images、Shutterstock等大型付费图库经已不再接收由DALL·E 2、Stable Diffusion、Midjourney等生成的AI画作。这也在一定程度成为AIGC迈向商业化的阻碍。
而对于AI画作的版权是归属于AI画家,还是归属于平台也一直为外界所诟病。目前我国《著作权法》中规定,著作权的指向对象为“作品”,且“作者”只能是自然人、法人或非法人组织。
因此有人呼吁为人工智能建立新的法律保护形式,而不是试图将旧的法定方案(包括历史上对人类发明家和作者的依赖)应用于这些新问题。
另外,人工智能算法存在固有缺陷导致内容质量层次不齐。
比如近日ChatGPT因回答内容中多次出现错漏,已被程序设计领域的问答网站Stack Overflow暂时禁用。
据悉,ChatGPT面世之后,Stack Overflow上很快便出现了大量由该模型生成的答案。这些答案通常需要具备一些专业知识的人详细阅读才能分辨出是错误的。
很快ChatGPT的创始团队也承认:“因为AI生成的答案不总是准确或相关的,可能会导致Stack Overflow上混淆错误答案,误导在寻求帮助的用户。”并且还表态:“Stack Overflow禁止用AI生成答案是合理的。”
虽然AIGC的相关概念十分火热,但对于其大规模商业化在业内人士看来仍需时日。
浙商证券研究所分析认为,AI绘画商业化方面仍处于摸索阶段,变现方式较为单一。从C端上看,应用场景商业化性价较低,付费意愿有待提升。“行业未来B端变现路径更为多元、成熟,若B端能挖掘出较为可行的商业模型,付费的可能性和水平相对更高。