Spaces:

vaibhavpandeyvpz
/

wan2.2-text-image-to-video

Running on Zero

vaibhavpandeyvpz commited on 5 days ago

Commit

3f66ae1

1 Parent(s): 5a81bcf

Fix handling on missing flash-attn

Files changed (1) hide show

wan/modules/model.py CHANGED Viewed

@@ -6,7 +6,7 @@ import torch.nn as nn
 from diffusers.configuration_utils import ConfigMixin, register_to_config
 from diffusers.models.modeling_utils import ModelMixin
-from .attention import flash_attention
 __all__ = ["WanModel"]
@@ -141,7 +141,7 @@ class WanSelfAttention(nn.Module):
         q, k, v = qkv_fn(x)
-        x = flash_attention(
             q=rope_apply(q, grid_sizes, freqs),
             k=rope_apply(k, grid_sizes, freqs),
             v=v,
@@ -172,7 +172,7 @@ class WanCrossAttention(WanSelfAttention):
         v = self.v(context).view(b, -1, n, d)
         # compute attention
-        x = flash_attention(q, k, v, k_lens=context_lens)
         # output
         x = x.flatten(2)

 from diffusers.configuration_utils import ConfigMixin, register_to_config
 from diffusers.models.modeling_utils import ModelMixin
+from .attention import attention
 __all__ = ["WanModel"]
         q, k, v = qkv_fn(x)
+        x = attention(
             q=rope_apply(q, grid_sizes, freqs),
             k=rope_apply(k, grid_sizes, freqs),
             v=v,
         v = self.v(context).view(b, -1, n, d)
         # compute attention
+        x = attention(q, k, v, k_lens=context_lens)
         # output
         x = x.flatten(2)