《万字长文带你解读AIGC》系列之入门篇( 三 )


AIGC 带来的另一个变化是消费者和创作者之间的边界变得模糊 。在 Web 2.0 时代,内容生成者和消费者通常是不同的用户 。然而,在 Web 3.0 中,借助 AIGC,数据消费者现在可以成为数据创作者,因为他们能够使用 AI 算法和技术来生成自己的原创内容,这使得他们能够更好地控制他们生产和消费的内容,使用自己的数据和 AI 技术来生产符合自己特定需求和兴趣的内容 。总的来说,向 AIGC 的转变有可能大大改变数据消费和生产的方式,使个人和组织在他们创建和消费内容时具有更多的控制和灵活性 。接下来,我们将讨论为什么 AIGC 现在变得如此流行 。
2.2.2 技术条件
谈到AIGC技术时,人们首先想到的往往是深度学习算法,而忽略了其两个重要条件:数据访问和计算资源 。
首先,让我们一起唠唠在数据获取方面取得的进展 。深度学习是在数据上训练模型的典型案例 。模型的性能在很大程度上取决于训练数据的大小 。通常情况下,模型的性能随着训练样本的增多而提高 。以图像分类为例,是一个常用的数据集,拥有超过100万张图片,用于训练模型和验证性能 。生成式AI通常需要更大的数据集,特别是对于像文本到图像这样具有挑战性的 AIGC 任务 。例如,DALLE使用了大约2.5亿张图片进行训练 。DALL-E 2则使用了大约6.5亿张图片 。是基于GPT3构建的,该模型部分使用数据集进行训练,该数据集在过滤前有 45TB 的压缩纯文本,过滤后只有 570GB 。其他数据集如、/2和也参与了 GPT3 的训练 。访问如此庞大的数据集主要得益于互联网的开放 。
AIGC的发展另一个重要因素是计算资源的进步 。早期的人工智能算法是在CPU上运行的,这不能满足训练大型深度学习模型的需求 。例如,是第一个在完整的上训练的模型,训练是在图形处理器GPU上完成的 。GPU 最初是为了在视频游戏中呈现图形而设计的,但现在在深度学习中变得越来越常见 。GPU 高度并行化,可以比 CPU 更快地执行矩阵运算 。众所周知,是制造 GPU 的巨头公司 。其 CUDA 计算能力从 2006 年的第一个 CUDA- GPU( 8800)到最近的 GPU()已经提高了数百倍 。GPU 的价格可以从几百美元到几千美元不等,这取决于核心数和内存大小 。类似的,Units(TPU)是由专门为加速神经网络训练而设计的专用处理器 。TPU 在Cloud 平台上可用,价格因使用和配置而异 。总的来说,计算资源的价格越来越实惠 。
关于《万字长文带你解读AIGC》系列之入门篇就先讲到这里,后续我们将分四个章进行介绍,包括:
后续所有章节更新完毕后,我们将统一整理成完整版的 PDF 文档形式送给各位小伙伴,欢迎持续关注!
【《万字长文带你解读AIGC》系列之入门篇】如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!欢迎添加小编微信号: ,备注"CSDN",加入 CVHub 官方学术&技术交流群,一起探讨更多有趣的话题!