fix(mm): vllm model calculates its own size

2026-04-23 03:00:31 -04:00 · 2025-03-27 06:30:40 +10:00
parent ffb5f6c6a6
commit 2fb37d38e6
2 changed files with 9 additions and 0 deletions
--- a/invokeai/backend/llava_onevision_model.py
+++ b/invokeai/backend/llava_onevision_model.py
@@ -47,3 +47,10 @@ class LlavaOnevisionModel(RawModel):

    def to(self, device: Optional[torch.device] = None, dtype: Optional[torch.dtype] = None) -> None:
        self._vllm_model.to(device=device, dtype=dtype)
+
+    def calc_size(self) -> int:
+        """Get size of the model in memory in bytes."""
+        # HACK(ryand): Fix this issue with circular imports.
+        from invokeai.backend.model_manager.load.model_util import calc_module_size
+
+        return calc_module_size(self._vllm_model)
--- a/invokeai/backend/model_manager/load/model_util.py
+++ b/invokeai/backend/model_manager/load/model_util.py
@@ -15,6 +15,7 @@ from invokeai.backend.image_util.depth_anything.depth_anything_pipeline import D
 from invokeai.backend.image_util.grounding_dino.grounding_dino_pipeline import GroundingDinoPipeline
 from invokeai.backend.image_util.segment_anything.segment_anything_pipeline import SegmentAnythingPipeline
 from invokeai.backend.ip_adapter.ip_adapter import IPAdapter
+from invokeai.backend.llava_onevision_model import LlavaOnevisionModel
 from invokeai.backend.model_manager.taxonomy import AnyModel
 from invokeai.backend.onnx.onnx_runtime import IAIOnnxRuntimeModel
 from invokeai.backend.patches.model_patch_raw import ModelPatchRaw
@@ -50,6 +51,7 @@ def calc_model_size_by_data(logger: logging.Logger, model: AnyModel) -> int:
            SegmentAnythingPipeline,
            DepthAnythingPipeline,
            SigLipPipeline,
+            LlavaOnevisionModel,
        ),
    ):
        return model.calc_size()