可能有不对的地方大佬看到了请指出。
先从AI为什么能作画开始说,假设记图片为x,那么P(X)就是指图片属于的概率分布。如果我们知道P(X)的数学公式,那么就可以从分布中采样生成图片。但是现实中图片概率分布不可能用一个数学式子写出来,所以只能用某种方式对它建模。就在2020年一篇叫DDPM论文开启了扩散模型研究热潮。这种模型就是对P(X)做最大似然建模,因为生成效果很好所以最近看到的AI绘图基本都是基于扩散模型去做的。比如Dalle2,Stable Diffusion之类的。
AI到底是不是在缝图?就像上面说的,AI是对训练数据(就是一堆图片)做似然建模拟合P(X),模型不可能在训练数据里左缝一点图,右缝一点图。推理的时候模型只会P(X)采样一个向量,这个向量因为在建模的P(X)里,所以确实会跟数据集长得很像,但是也许在P(X)采样的向量就是数据集从来没出现过的图片,所以AI还是有创新能力的。