NVIDIA · Fridah-nv · Mar 16, 2026 · Mar 16, 2026 · Mar 16, 2026 · Mar 16, 2026
@@ -1045,7 +1045,7 @@ def validate_calibrator(cls, v, info: ValidationInfo):
     )
 
 
-class QuantizeAlgorithmConfig(ModeloptBaseConfig):
+class CalibrationConfig(ModeloptBaseConfig):
     """Calibration algorithm config base."""
 
     method: Literal[None] = ModeloptField(
@@ -1084,8 +1084,39 @@ class QuantizeAlgorithmConfig(ModeloptBaseConfig):
         ),
     )
 
+    include_modules: list[str] | None = ModeloptField(
+        default=None,
+        title="Patterns of modules to include in calibration.",
+        description=(
+            "If provided, only modules whose names match at least one of the fnmatch patterns are "
+            "calibrated. Modules that do not match any pattern are skipped and retain their "
+            "pre-existing calibration state. "
+            "If a module name matches both ``include_modules`` and ``exclude_modules``, "
+            "exclusion takes precedence and the module is skipped. "
+            "Note: filtering applies only to quantized linear modules; TensorQuantizers in "
+            "non-linear modules (e.g. layer norms, embeddings) are unaffected."
+        ),
+    )
+
+    exclude_modules: list[str] | None = ModeloptField(
+        default=None,
+        title="Patterns of modules to exclude from calibration.",
+        description=(
+            "If provided, modules whose names match at least one of the fnmatch patterns are "
+            "skipped during calibration and retain their pre-existing calibration state. "
+            "If a module name matches both ``include_modules`` and ``exclude_modules``, "
+            "exclusion takes precedence. "
+            "Note: filtering applies only to quantized linear modules; TensorQuantizers in "
+            "non-linear modules (e.g. layer norms, embeddings) are unaffected."
+        ),
+    )
+
+
+# Backward-compatible alias — deprecated, will be removed in a future release.
+QuantizeAlgorithmConfig = CalibrationConfig
+
 
-class MaxCalibConfig(QuantizeAlgorithmConfig):
+class MaxCalibConfig(CalibrationConfig):
     """The config for max calibration algorithm.
 
     Max calibration estimates max values of activations or weights and use this max values
@@ -1102,7 +1133,7 @@ class MaxCalibConfig(QuantizeAlgorithmConfig):
     )
 
 
-class MseCalibConfig(QuantizeAlgorithmConfig):
+class MseCalibConfig(CalibrationConfig):
     """Configuration for per-tensor MSE calibration.
 
     Finds a scale s (via amax a, with s = a / q_max) that minimizes the
@@ -1152,7 +1183,7 @@ class MseCalibConfig(QuantizeAlgorithmConfig):
     )
 
 
-class LocalHessianCalibConfig(QuantizeAlgorithmConfig):
+class LocalHessianCalibConfig(CalibrationConfig):
     """Configuration for local Hessian-weighted MSE calibration.
 
     This algorithm uses activation information to optimize per-block scales for weight
@@ -1219,7 +1250,7 @@ class LocalHessianCalibConfig(QuantizeAlgorithmConfig):
     )
 
 
-class SmoothQuantCalibConfig(QuantizeAlgorithmConfig):
+class SmoothQuantCalibConfig(CalibrationConfig):
     """The config for ``smoothquant`` algorithm (SmoothQuant).
 
     SmoothQuant applies a smoothing factor which balances the scale of outliers in weights and activations.
@@ -1241,7 +1272,7 @@ class SmoothQuantCalibConfig(QuantizeAlgorithmConfig):
     )
 
 
-class AWQLiteCalibConfig(QuantizeAlgorithmConfig):
+class AWQLiteCalibConfig(CalibrationConfig):
     """The config for ``awq_lite`` (AWQ lite) algorithm.
 
     AWQ lite applies a channel-wise scaling factor which minimizes the output difference after quantization.
@@ -1265,7 +1296,7 @@ class AWQLiteCalibConfig(QuantizeAlgorithmConfig):
     )
 
 
-class AWQClipCalibConfig(QuantizeAlgorithmConfig):
+class AWQClipCalibConfig(CalibrationConfig):
     """The config for ``awq_clip`` (AWQ clip) algorithm.
 
     AWQ clip searches clipped amax for per-group quantization, This search requires much more compute
@@ -1331,7 +1362,7 @@ class AWQFullCalibConfig(AWQLiteCalibConfig, AWQClipCalibConfig):
     )
 
 
-class SVDQuantConfig(QuantizeAlgorithmConfig):
+class SVDQuantConfig(CalibrationConfig):
     """The config for SVDQuant.
 
     Refer to the `SVDQuant paper <https://arxiv.org/pdf/2411.05007>`_ for more details.
@@ -1349,7 +1380,7 @@ class SVDQuantConfig(QuantizeAlgorithmConfig):
     )
 
 
-class GPTQLiteConfig(QuantizeAlgorithmConfig):
+class GPTQLiteConfig(CalibrationConfig):
     """The config for GPTQ lite.
 
     GPTQ lite is a variant of GPTQ that does not exactly follow the official GPTQ implementation.
@@ -1394,7 +1425,7 @@ class GPTQLiteConfig(QuantizeAlgorithmConfig):
     | dict[str | Callable, QuantizerAttributeConfig | list[QuantizerAttributeConfig]],
 ]
 
-_QuantizeAlgoCfgType = str | dict | QuantizeAlgorithmConfig | None
+_QuantizeAlgoCfgType = str | dict | CalibrationConfig | None
 
 QuantizeAlgoCfgType = _QuantizeAlgoCfgType | list[_QuantizeAlgoCfgType] | None
 

@@ -36,13 +36,13 @@
     AWQClipCalibConfig,
     AWQFullCalibConfig,
     AWQLiteCalibConfig,
+    CalibrationConfig,
     CompressConfig,
     GPTQLiteConfig,
     LocalHessianCalibConfig,
     MaxCalibConfig,
     MseCalibConfig,
     QuantizeAlgoCfgType,
-    QuantizeAlgorithmConfig,
     QuantizeConfig,
     SmoothQuantCalibConfig,
     SVDQuantConfig,
@@ -59,6 +59,7 @@
 )
 from .model_calib import (
     awq,
+    filter_calib_modules,
     gptq_lite,
     local_hessian_calibrate,
     max_calibrate,
@@ -210,7 +211,7 @@ def name(self) -> str:
 
 def wrapped_calib_func(
     model: ModelLikeModule,
-    config: QuantizeAlgorithmConfig,
+    config: CalibrationConfig,
     forward_loop: ForwardLoop | None = None,
     func: Callable | None = None,
 ) -> ConvertReturnType:
@@ -223,6 +224,8 @@ def wrapped_calib_func(
     kwargs = config.model_dump()
     method = kwargs.pop("method")
     sequential = kwargs.pop("use_sequential", False)
+    include_modules = kwargs.pop("include_modules", None)
+    exclude_modules = kwargs.pop("exclude_modules", None)
     if method is not None and "awq" in method:
         # For backward compatibility
         kwargs["algorithm"] = method
@@ -243,22 +246,23 @@ def wrapped_calib_func(
                 module._moe_count_expert_calib_tokens = True
 
     if func is not None:
-        if sequential:
-            if forward_loop is None:
-                raise ValueError("forward_loop is required for calibration but got None.")
-            assert method in ["max"], (
-                f"Sequential calibration currently only supports max calibration, got {method}"
-            )
-            # Wrap with sequential processing
-            sequential_calibrate(
-                model,
-                forward_loop=forward_loop,
-                calib_func=func,
-                **kwargs,
-            )
-        else:
-            # Direct calibration (existing behavior)
-            func(model, forward_loop=forward_loop, **kwargs)
+        with filter_calib_modules(model, include_modules, exclude_modules):
+            if sequential:
+                if forward_loop is None:
+                    raise ValueError("forward_loop is required for calibration but got None.")
+                assert method in ["max"], (
+                    f"Sequential calibration currently only supports max calibration, got {method}"
+                )
+                # Wrap with sequential processing
+                sequential_calibrate(
+                    model,
+                    forward_loop=forward_loop,
+                    calib_func=func,
+                    **kwargs,
+                )
+            else:
+                # Direct calibration (existing behavior)
+                func(model, forward_loop=forward_loop, **kwargs)
 
     # Lets get the latest metadata for the quantizer states
     metadata = {}
@@ -270,7 +274,7 @@ class BaseCalibrateModeDescriptor(ModeDescriptor):
     """Base class for quantization calibration algorithm modes.
 
     All calibration algorithm modes must be derived from this base class.
-    In addition, the `config_class` for the mode must return a subclass of :class:`QuantizeAlgorithmConfig`.
+    In addition, the `config_class` for the mode must return a subclass of :class:`CalibrationConfig`.
 
     This base class also provides some convenient wrappers/utilities for calibration algorithms to be
     translated into ModelOpt mode.
@@ -289,8 +293,8 @@ class BaseCalibrateModeDescriptor(ModeDescriptor):
 
     def __init__(self, *args, **kwargs):
         """Initialize Base calibrate mode descriptor."""
-        assert issubclass(self.config_class, QuantizeAlgorithmConfig), (
-            f"`config_class` of {self.__class__} must be a subclass of `QuantizeAlgorithmConfig`!, "
+        assert issubclass(self.config_class, CalibrationConfig), (
+            f"`config_class` of {self.__class__} must be a subclass of `CalibrationConfig`!, "
             f"got {self.config_class}!"
         )
         super().__init__(*args, **kwargs)
@@ -311,7 +315,7 @@ def name(self) -> str:
 
     @property
     @abstractmethod
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
 
     @property
@@ -386,9 +390,9 @@ class NoneCalibrateModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for no calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
-        return QuantizeAlgorithmConfig
+        return CalibrationConfig
 
     _calib_func = None
 
@@ -398,7 +402,7 @@ class MaxCalibrateModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for max calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return MaxCalibConfig
 
@@ -410,7 +414,7 @@ class MseCalibrateModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for mse calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return MseCalibConfig
 
@@ -426,7 +430,7 @@ class LocalHessianModeDescriptor(BaseCalibrateModeDescriptor):
     """
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return LocalHessianCalibConfig
 
@@ -438,7 +442,7 @@ class SmoothQuantModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for smoothquant calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return SmoothQuantCalibConfig
 
@@ -450,7 +454,7 @@ class AWQLiteModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for AWQ lite calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return AWQLiteCalibConfig
 
@@ -462,7 +466,7 @@ class AWQClipModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for AWQ clip calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return AWQClipCalibConfig
 
@@ -474,7 +478,7 @@ class AWQFullModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for AWQ full calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return AWQFullCalibConfig
 
@@ -486,7 +490,7 @@ class SVDQuantModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for SVDQuant calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return SVDQuantConfig
 
@@ -503,7 +507,7 @@ class GPTQLiteModeDescriptor(BaseCalibrateModeDescriptor):
     """Mode for GPTQ calibration algorithm."""
 
     @property
-    def config_class(self) -> type[QuantizeAlgorithmConfig]:
+    def config_class(self) -> type[CalibrationConfig]:
         """Specifies the config class for the mode."""
         return GPTQLiteConfig