自分の環境下でのA1111 webui-user.shのオプション設定
#!/bin/bash
#########################################################
# Uncomment and change the variables below to your need:#
#########################################################
# Install directory without trailing slash
#install_dir="/home/$(whoami)"
# Name of the subdirectory
#clone_dir="stable-diffusion-webui"
# Commandline arguments for webui.py, for example: export COMMANDLINE_ARGS="--medvram --opt-split-attention"
export COMMANDLINE_ARGS=" --upcast-sampling --opt-sub-quad-attention --no-half-vae --precision full"
# python3 executable
#python_cmd="python3"
# git executable
#export GIT="git"
# python3 venv without trailing slash (defaults to ${install_dir}/${clone_dir}/venv)
#venv_dir="venv"
# script to launch to start the app
#export LAUNCH_SCRIPT="launch.py"
# install command for torch
#export TORCH_COMMAND="pip install torch==1.12.1+cu113 --extra-index-url https://download.pytorch.org/whl/cu113"
export TORCH_COMMAND="pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/rocm5.7"
export HSA_OVERRIDE_GFX_VERSION=11.0.0
# Requirements file to use for stable-diffusion-webui
#export REQS_FILE="requirements_versions.txt"
# Fixed git repos
#export K_DIFFUSION_PACKAGE=""
#export GFPGAN_PACKAGE=""
# Fixed git commits
#export STABLE_DIFFUSION_COMMIT_HASH=""
#export CODEFORMER_COMMIT_HASH=""
#export BLIP_COMMIT_HASH=""
# Uncomment to enable accelerated launch
#export ACCELERATE="True"
# Uncomment to disable TCMalloc
#export NO_TCMALLOC="True"
###########################################
AMD GPUの場合は、’–upcast-sampling –opt-sub-quad-attention –precision full’辺りは必須らしい。’–no-half-vae’を追記すると生成速度がかなり上がった。
‘HSA_OVERRIDE_GFX_VERSION=11.0.0’の部分は、GPUによってバージョンが変わるので注意。
あと、a1111とforge両方入れてみたけど、結局のところa1111しか使ってない。
forgeはなんというか微妙。VRAM 20GBのRX 7900XTでは恩恵よりも、VRAMを食い尽くして解放してくれないデメリットのほうが大きい。
Ubuntu ROCm5.7 A1111 引数設定