Skip to content

为什么qwen-image-edit进入vae的图像的长和宽要限制为32的倍数呢? #1213

@lucky-liuzhihong

Description

@lucky-liuzhihong

想请教一下为什么calculate_dimensions中要将图像的长和宽限制为32的倍数 我理解vae下采样率为8 latent进入dit之前patch embed的patch_size是2 那16的倍数应该就可以了吧?
而且比较奇怪的是训练代码中只在QwenImageUnit_EditImageEmbedder中对编辑任务中的condition images做出了32倍数的限制 却并未在QwenImageUnit_InputImageEmbedder对input(target) image做出这一限制

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions