efederici
/

ipt-125m

Text Generation

text-generation-inference

Model card Files Files and versions

efederici commited on May 18, 2023

Commit

2da0cf7

·

1 Parent(s): 4779b72

Update attention.py

Files changed (1) hide show

attention.py +1 -1

attention.py CHANGED Viewed

@@ -87,7 +87,7 @@ def flash_attn_fn(query, key, value, n_heads, softmax_scale=None, attn_bias=None
 def triton_flash_attn_fn(query, key, value, n_heads, softmax_scale=None, attn_bias=None, key_padding_mask=None, is_causal=False, dropout_p=0.0, training=False, needs_weights=False, multiquery=False):
     try:
-        from .flash_attn_triton import flash_attn_func
     except:
         raise RuntimeError('Please install flash-attn==1.0.3.post0 and triton==2.0.0.dev20221202')
     check_valid_inputs(query, key, value)

 def triton_flash_attn_fn(query, key, value, n_heads, softmax_scale=None, attn_bias=None, key_padding_mask=None, is_causal=False, dropout_p=0.0, training=False, needs_weights=False, multiquery=False):
     try:
+        from flash_attn import flash_attn_triton
     except:
         raise RuntimeError('Please install flash-attn==1.0.3.post0 and triton==2.0.0.dev20221202')
     check_valid_inputs(query, key, value)