2025-11-08 06:42:48
STVP就是给模型写提示,比如要画一只猫,然后Stable Diffusion根据这个提示生成图片。两者配合用,先写文字再出图。
因为模型得先认得文字,才能变出对应图。比如Stable Diffusion有1.7亿参数,训练两个月才记住各种图片和文字的关系。数据越多,变图越准。训练时用1000万张图配1000万句描述,这样模型才懂"猫"和"四条腿"连着用。要是提示词写"穿红衣服的猫",模型就知道要画穿红衣服的猫。但要是提示词乱写,比如"会飞的猫坐火箭",模型可能就画成猫在云朵上飞。所以用对提示词,就像给模型指路,指对了才能到对的地方。
本题链接: