[ROCM] Properly disable Flash Attention/Efficient Attention with environment variables #1541

xinyazhang · 2024-08-19T17:05:34Z

Now USE_FLASH_ATTENTION=0 USE_MEM_EFF_ATTENTION=0 python setup.py can compile correctly

This is a backported version from pytorch#133866

Tested with USE_FLASH_ATTENTION=0 USE_MEM_EFF_ATTENTION=0 python setup.py develop --user and python -c 'import torch'

…NTION=0

…M_EFF_ATTENTION=0

pruthvistony · 2024-08-20T06:09:36Z

The PR #1536 was merged. MEM_EFF_ATTENTION is always turned off, when it will be enabled?

pruthvistony · 2024-08-22T22:37:47Z

Not required.

xinyazhang added 3 commits August 19, 2024 16:40

Do not include aotriton if USE_FLASH_ATTENTION=0 AND USE_MEM_EFF_ATTE…

c5a3fba

…NTION=0

Disable AOTriton in sdp_utils.cpp if USE_FLASH_ATTENTION=0 AND USE_ME…

2c55af8

…M_EFF_ATTENTION=0

Disable ME on ROCM 6.2 internal testing branch

488c6ac

pruthvistony closed this Aug 22, 2024

Provide feedback