Arm backend: Increase qtol in Llama partial quant tests (pytorch#17816)

mansnils · web-flow · commit e248a99d7c86 · 2026-03-05T11:27:14.000+01:00
Additionally, * Adds new scale error log. * Fix error log by printing actual tolerance instead of hard coded values. cc @digantdesai @SS-JIA @freddan80 @per @zingo @oscarandersson8218 @Sebastian-Larsson @robell Signed-off-by: Måns Nilsson <mans.nilsson@arm.com>
diff --git a/backends/arm/test/models/test_llama.py b/backends/arm/test/models/test_llama.py
@@ -209,6 +209,8 @@ def test_llama_tosa_INT_FP_partial_quant():
             tosa_extensions=["FP"],
             # Due to a few outliers, atol must be set high
             atol=1.1,
+            # TODO(MLETORCH-1875): reduce tolerance
+            qtol=75,
             frobenius_threshold=None,
             cosine_threshold=None,
         )
@@ -232,6 +234,8 @@ def test_llama_vgf_quant_partial_quant():
             quantize=True,
             # Due to a few outliers, atol must be set high
             atol=1.1,
+            # TODO(MLETORCH-1875): reduce tolerance
+            qtol=75,
         )
         _use_partial_quantizer(pipeline)
         pipeline.run()
diff --git a/backends/arm/test/tester/analyze_output_utils.py b/backends/arm/test/tester/analyze_output_utils.py
@@ -318,6 +318,8 @@ def dump_error_output(
         output_node = export_stage.artifact.graph_module.graph.output_node()
         qp_input = get_input_quantization_params(export_stage.artifact)
         qp_output = get_output_quantization_params(output_node)
+        scales = {k.name: v.scale for k, v in qp_output.items() if v is not None}
+        logger.error(f"Output Quant scales: {scales}")
         logger.error(f"Input QuantArgs: {qp_input}")
         logger.error(f"Output QuantArgs: {qp_output}")
 
diff --git a/backends/arm/test/tester/arm_tester.py b/backends/arm/test/tester/arm_tester.py
@@ -999,9 +999,9 @@ def _compare_outputs(
                     stage_output,
                     reference_output,
                     quantization_scale=quantization_scale,
-                    atol=1e-03,
-                    rtol=1e-03,
-                    qtol=0,
+                    atol=atol,
+                    rtol=rtol,
+                    qtol=qtol,
                 )
             raise e