想请教一下为什么calculate_dimensions中要将图像的长和宽限制为32的倍数 我理解vae下采样率为8 latent进入dit之前patch embed的patch_size是2 那16的倍数应该就可以了吧?
而且比较奇怪的是训练代码中只在QwenImageUnit_EditImageEmbedder中对编辑任务中的condition images做出了32倍数的限制 却并未在QwenImageUnit_InputImageEmbedder对input(target) image做出这一限制