Fix bitsandbytes imports to avoid ImportErrors on MacOS.

2026-04-23 03:00:31 -04:00 · 2024-12-23 15:17:27 -05:00
parent f8ab414f99
commit f8a6accf8a
8 changed files with 121 additions and 84 deletions
--- a/tests/backend/model_manager/load/model_cache/torch_module_autocast/test_autocast_modules.py
+++ b/tests/backend/model_manager/load/model_cache/torch_module_autocast/test_autocast_modules.py
@@ -1,12 +1,17 @@
 import pytest
 import torch

-from invokeai.backend.model_manager.load.model_cache.torch_module_autocast.autocast_modules import (
-    CustomInvokeLinear8bitLt,
-    CustomInvokeLinearNF4,
-)
-from invokeai.backend.quantization.bnb_llm_int8 import InvokeLinear8bitLt
-from invokeai.backend.quantization.bnb_nf4 import InvokeLinearNF4
+if not torch.cuda.is_available():
+    pytest.skip("CUDA is not available", allow_module_level=True)
+else:
+    from invokeai.backend.model_manager.load.model_cache.torch_module_autocast.custom_invoke_linear_8_bit_lt import (
+        CustomInvokeLinear8bitLt,
+    )
+    from invokeai.backend.model_manager.load.model_cache.torch_module_autocast.custom_invoke_linear_nf4 import (
+        CustomInvokeLinearNF4,
+    )
+    from invokeai.backend.quantization.bnb_llm_int8 import InvokeLinear8bitLt
+    from invokeai.backend.quantization.bnb_nf4 import InvokeLinearNF4


@pytest.fixture
--- a/tests/backend/model_manager/load/model_cache/torch_module_autocast/test_torch_module_autocast.py
+++ b/tests/backend/model_manager/load/model_cache/torch_module_autocast/test_torch_module_autocast.py
@@ -6,9 +6,14 @@ from invokeai.backend.model_manager.load.model_cache.torch_module_autocast.torch
    apply_custom_layers_to_model,
    remove_custom_layers_from_model,
 )
-from invokeai.backend.quantization.bnb_llm_int8 import InvokeLinear8bitLt, quantize_model_llm_int8
 from tests.backend.quantization.gguf.test_ggml_tensor import quantize_tensor

+try:
+    from invokeai.backend.quantization.bnb_llm_int8 import InvokeLinear8bitLt, quantize_model_llm_int8
+except ImportError:
+    # This is expected to fail on MacOS
+    pass
+
 cuda_and_mps = pytest.mark.parametrize(
    "device",
    [