前言

AI作为一门新的技术科学,自诞生以来就获得了极为快速的发展,并被应用到愈来愈多的领域。但对于AI,人们普遍认为:AI能够从事的主要是简单的、具有重复性的劳动,而绘画、写作、创作剧本等具有创造性的劳动则是人类的专利。直到近两年ChatGPT、Midjourney等应用出现才打破了这种“固有偏见”,让我们意识到人工智能并不是人类的智能,它不仅能够像人一样思考,更有可能超过人类的智能。

2022年,AIGC(AI Generated Content,人工智能生成内容)强势“出道”,成为炙手可热的概念。2022年9月,AI绘画火爆全网;2022年11月30日,ChatGPT横空出世;2022年12月16日,Science杂志发布了“2022年度科学十大突破”,AIGC也入选在列。诸多AIGC应用展示出的强大的内容生产能力足以说明:AIGC绝不会昙花一现,有望引领我们进入一个新的时代。

AIGC的暴火看似有些突然,但实质上是技术积累与发展策略双重变革的产物。技术方面,GAN、Transformer、扩散模型等基础的生成算法模型在过去几年取得了明显的进步,在拥有的性能、所具备的稳定性和能够生成的内容质量等方面均获得了明显提升,从而使得AIGC能够生成高质量的文字、图像、音视频等各种内容;预训练模型的出现解决了以往各生成模型生成内容质量低、训练成本高、使用门槛高等痛点,能够满足不同功能、任务、场景等的需求,而且基于预训练模型,AIGC应用的通用化能力获得极大提升;在以上模型的基础上,多模态技术则使AIGC不仅能够生成不同模态的内容,而且不同内容可以实现转换,比如将代表同一信息的文字和图片进行关联,从而进一步增强了AIGC模型的通用化水平。未来,随着相关算法等技术的突破,拥有极强学习能力的多模态AIGC应用将展现出更大的潜力,推动人工智能进入新的发展阶段。

除技术领域的积累外,AIGC的暴火也离不开产业生态的有力支撑。目前,AIGC产业的生态体系大致可以分为三层:第一层为基础层,主要涵盖围绕预训练模型构建AIGC相关基础设施的企业,如Stability AI、OpenAI等;第二层为中间层,主要涵盖基于预训练模型形成垂直化、场景化、定制化的小模型和应用工具的企业,如Novel AI等;第三层为应用层,主要涵盖基于底层模型和中间层的垂直模型而开发AIGC产品和服务的企业,面向的用户既包括B端用户,也包括C端用户。

与以往的PGC(Professional Generated Content,专业生成内容)、UGC(User Generated Content,用户生成内容)不同,AIGC在感知世界、理解世界、生成世界乃至创造世界等层面均实现了跃迁,已经成为一种生产力引擎,将给消费互联网、产业互联网以及其他社会价值领域带来不容忽视的影响。比如,在广告领域,AIGC能够分析用户的需求,获得用户的真正意图,进而生成具有创意的、量身定制的广告文案、视频等,不仅效率极高,而且能够大幅降低制作成本。再比如,在医疗健康领域,AIGC能够用于阿尔茨海默病患者的精神护理、能够帮助渐冻症患者等无法开口说话的群体重新获得“自己的声音”。随着AIGC能够生成的内容质量越来越高、内容类型不断丰富、内容的通用性和工业化水平逐渐提升,其能够应用的领域也将更为广阔。

由于能够从根本上降低内容生成的门槛,AIGC将可能引起社会成本结构和行业体系的变革。不过,AIGC作为一个新生事物,在大放异彩的同时,也可能会带来诸多问题和挑战。比如,伴随AIGC的发展衍生的安全问题、侵权风险、伦理问题、环境危害等均需要我们谨慎应对。

要拥抱AIGC,迎接更美好的未来,首先应该正确认识AIGC。本书立足于AIGC技术前沿与发展趋势,全面阐述了AIGC的概念内涵、底层技术与应用场景,详细梳理全球科技巨头在AIGC领域的战略布局,并辅之以大量生动有趣的案例,深度剖析AIGC在各行业领域的应用场景,旨在引导读者真切感受AIGC革命浪潮蕴含的商业创造力。

全书分为五个部分,共18章。

●第一部分:AIGC智能创作。AIGC的兴起,不仅能够带来创作方式和内容产业的变革,还预示着人类社会生产方式可能发生深刻变化,并影响人类社会的演进方向。随着AI能力的提升,AIGC将能够代替人类完成许多技术性、创造性工作;随着AI应用范围的扩大,AIGC也有望大幅提升社会经济生产力,促进生产关系变革,进而改变人们的生活方式。

●第二部分:AIGC产业图谱。根据技术研究咨询机构Gartner于2022年9月发布的报告——《人工智能技术成熟度曲线》显示,与AIGC密切相关的生成式设计AI(Generative Design AI)模型将在未来的几年内快速成长,预计在5~10年内实现成熟应用。AIGC的繁荣发展,有助于推动形成集AI数字内容资产管理、产权保护、合规性评估等产业服务的完整生态链,将技术优势转化为实际商业价值,促进数字经济发展。

●第三部分:AIGC商业落地。随着AIGC相关技术的发展和众多应用的推出,其在内容、电商、营销、建筑等领域将逐步扩大商业化应用,并对人类经济社会发展产生深远影响。比如,电商领域的商家可以利用AIGC来自动构建商品三维模型、虚拟主播和虚拟货场,并综合使用基于AIGC的相关应用产品来提高响应消费者需求的速度和准确性,同时通过构建沉浸式的消费场景来优化消费者的消费体验。

●第四部分:AIGC与ChatGPT。ChatGPT融合了深度学习、机器学习等技术,可以利用数据集进行训练,并能够实现文本生成功能,为人们提供聊天问答、语言翻译、摘要生成等服务,同时也可以根据用户输入的信息生成文本建议。ChatGPT之所以能够在短时间内吸引众多目光并获得好评,主要的原因就在于它使得人机之间的对话更加自然流畅、富有逻辑性,使得机器更具有人性化的特征。

●第五部分:AIGC与元宇宙。AIGC在多个数字内容创作领域都有着巨大优势,可以辅助数字媒体、数字藏品、数字场景和虚拟数字人的内容生成,并支持从文字信息、图像信息到音视频信息等的多模态转化。AIGC能够高效生成原生数字内容,在元宇宙构建中发挥重要作用,进一步推动各类应用场景的虚实融合。

本书虽然以AIGC为介绍对象,但内容并不晦涩难懂,是一本面向大众读者从科普视角切入的趣味性读物,力求用通俗易懂的语言带领读者了解AIGC。因此,本书既适合政策制定者、投资者、创业者阅读,也可供互联网科技行业的技术、管理人员以及其他对AIGC感兴趣的读者阅读参考。

著者