feat: make the last layer over 7 bits

2026-02-08 19:44:57 -05:00 · 2021-12-16 18:24:27 +01:00
parent bb332861aa
commit 25e12530d1
1 changed files with 6 additions and 1 deletions
--- a/concrete/quantization/post_training.py
+++ b/concrete/quantization/post_training.py
@@ -88,7 +88,12 @@ class PostTrainingAffineQuantization:
                # Create a QuantizedLinear layer
                q_weights = self.quant_params[f"{name}.weight"]
                q_bias = self.quant_params[f"{name}.bias"]
-                q_layer = QuantizedLinear(self.n_bits, q_weights, q_bias)
+                # Check if layer is last layer from the model
+                if name == list(self.numpy_model.torch_model.named_children())[-1][0]:
+                    # If last layer, we can use 7 bits (maximum allowed) of precision.
+                    q_layer = QuantizedLinear(7, q_weights, q_bias)
+                else:
+                    q_layer = QuantizedLinear(self.n_bits, q_weights, q_bias)
                # Calibrate and get new calibration_data for next layer/activation
                calibration_data = self._calibrate_layers_activation(
                    name, q_layer, calibration_data